Como Consegui Dois Contratos de Avaliador de IA Sem Licenciatura em Tecnologia

Laptop com cartões de comparação lado a lado e rubrica para trabalho de RLHF e avaliador de IA

O trabalho de avaliador de IA é a linha de microtarefas bem paga mais discreta do ecossistema. Tropecei nela por acidente no início de 2024, e até ao final do ano tinha acumulado pouco mais de 4.300 euros em dois fornecedores de nicho. Ninguém nos fóruns de microtarefas mainstream fala sobre isso, porque as pessoas que entram tendem a guardar para si.

Em que consiste realmente o trabalho

Na prática, lês um prompt, lês duas ou três respostas do modelo, e classificas-as de acordo com um critério. Às vezes escreves uma versão melhor tu próprio. Às vezes anotas qual das duas respostas é mais segura, mais verdadeira ou mais útil. Os tipos de tarefas que tratei foram: classificação de preferências, verificação de factos, rotulagem de segurança e reescrita. Nenhuma requeria formação técnica. Todas requeriam inglês escrito claro e a capacidade de justificar uma classificação em duas a quatro frases sem rodeios.

De onde vêm realmente as oportunidades

Não das grandes plataformas mainstream. Os dois contratos que consegui vieram através de fornecedores de nicho que atuam como intermediários entre os laboratórios de IA e os avaliadores individuais. Pensa neles como agências de emprego. No meu caso: um fornecedor com sede no Reino Unido que trata de dados de preferência para um grande laboratório, e um fornecedor europeu que realiza avaliações de segurança para um laboratório diferente. Ambos foram encontrados pesquisando no LinkedIn por funções marcadas como Data Analyst Part Time com palavras-chave preference data ou RLHF, depois candidatando-me diretamente. Para o manual completo sobre como encontrar trabalho discreto que ninguém anuncia, o hub Freelance tem a minha estratégia completa.

  1. Pesquisa no LinkedIn: filtrar por part time, contrato, remoto; palavras-chave RLHF, AI annotation, preference data, rater.
  2. Páginas de empresas: identificar 8 a 12 fornecedores de nicho, segui-los, candidatar a qualquer função de avaliador que surja.
  3. Triagem: espera uma tarefa escrita não paga de 90 minutos, tipicamente 4 a 6 exercícios de classificação.
  4. Entrevista: uma chamada de 20 a 30 minutos com um gestor de programa. Não técnica, focada no pensamento por critérios.
  5. Lote de qualificação pago: 2 a 5 horas de trabalho pago avaliado de acordo com referências internas. Passa e estás dentro.

O dinheiro, sem hype

Nos meus dois contratos, as taxas ficaram em 18 e 22 euros por hora respetivamente. As condições de pagamento eram a 15 dias para o primeiro fornecedor e a 30 dias para o segundo, ambas por transferência bancária SEPA com faturação de IVA no meu regime de trabalhador independente. O volume variou bastante; num mês registei 41 horas pagas, no mês seguinte sete. Trata-o como uma linha de alta taxa e baixa fiabilidade e funciona. Trata-o como substituto de salário e vai arruinar o teu orçamento.

Para a comparação com outras linhas freelance que corro em paralelo, o artigo Prolific vs Userlytics é a leitura complementar. Para a mentalidade por trás de combinar vários fluxos de rendimento pequenos para que nenhum tenha de te sustentar sozinho, o artigo sobre aplicações de dividendos aplica a mesma lógica numa linha diferente.

Os sinais de alerta que me custaram tempo

Candidatei-me a onze fornecedores antes da minha primeira oferta. Três eram esquemas ou próximos de MLM, dois nunca responderam, quatro fizeram-me passar por uma triagem e depois desapareceram. Os dois restantes pagaram. Sinais de alerta que agora filtro imediatamente: triagens não pagas com mais de duas horas, taxas anunciadas acima de 40 dólares por hora para avaliadores generalistas, qualquer fornecedor que peça um pagamento de teste ou uma verificação de crédito, e qualquer função que exija pagar por um curso de formação. Os fornecedores legítimos pagam o lote de qualificação, sempre.

A dica rara do John

Escreve uma avaliação de amostra limpa e reutiliza-a

As triagens quase sempre pedem que classifiques dois resultados de modelo e justifiques a tua classificação. Escrevi um modelo de avaliação, 180 palavras, estruturado como o que o prompt pedia, como cada resposta o tratou, porque classifico A acima de B. Reutilizar essa estrutura em cada triagem reduziu o meu tempo de escrita de 90 minutos para 40 minutos, e pontuou-me acima do limite em quatro de cinco candidaturas.

O que evitaria

Não assines um NDA sem ler a cláusula de não concorrência. Um fornecedor ofereceu-me um contrato de 24 euros por hora que me teria bloqueado para qualquer outro trabalho de anotação de IA durante 12 meses após a rescisão. Recusei, aceitei a oferta de 18 euros por hora que não tinha essa cláusula, e mantive a opção de acumular um segundo contrato seis meses depois. A flexibilidade valeu os 6 euros.

Perguntas frequentes

Preciso de formação técnica para avaliar resultados de IA?

Não, mas precisas de escrita clara em inglês e um olhar paciente para as nuances. A minha formação é em trading desportivo, não em aprendizagem automática, e passei na triagem à segunda tentativa. O que realmente importa é a capacidade de justificar uma avaliação num parágrafo limpo.

Quanto tempo demora desde a candidatura até à primeira tarefa paga?

Três a seis semanas na minha experiência. O processo de integração passa por um recrutador, uma triagem escrita, uma breve entrevista e, depois, um lote de qualificação pago. Tudo o que seja mais rápido do que três semanas é normalmente um programa de remuneração mais baixa de que deves desconfiar.

O rendimento é suficientemente estável para planear?

Não mensalmente. Os programas aumentam e diminuem em ondas de quatro a oito semanas. Já vi 30 horas semanais oferecidas e depois zero durante duas semanas. Trata-o como uma linha de alta taxa e baixa fiabilidade, não como um salário.