Cum Am Obținut Două Contracte de Evaluator AI Fără o Diplomă Tehnică

Laptop cu carduri de comparație alăturate și rubrică pentru munca RLHF și evaluator AI

Munca de evaluator AI este cea mai discretă sursă bine plătită de microtaskuri din ecosistem. Am dat peste ea din întâmplare la începutul lui 2024 și până la sfârșitul anului obținusem puțin peste 4.300 de euro de la doi furnizori de nișă. Nimeni pe forumurile de microtaskuri mainstream nu vorbește despre ea, pentru că cei care intră tind să păstreze secretul.

În ce constă munca de fapt

În practică, citești un prompt, citești două sau trei răspunsuri ale unui model și le clasifici conform unui barem. Uneori scrii tu însuți o versiune mai bună. Alteori adnotezi care dintre două răspunsuri este mai sigur, mai corect sau mai util. Tipurile de sarcini pe care le-am gestionat au fost: clasificare preferințe, verificare fapte, etichetare siguranță și rescriere. Niciunul nu a necesitat un background tehnic. Toate au necesitat engleză scrisă clară și capacitatea de a justifica o evaluare în două până la patru propoziții fără exagerări.

De unde vin de fapt contractele

Nu de pe platformele mainstream mari. Cele două contracte pe care le-am obținut au venit prin furnizori de nișă care acționează ca intermediari între laboratoarele AI și evaluatorii individuali. Gândește-te la ei ca la agenții de recrutare. În cazul meu: un furnizor cu sediul în UK care gestionează date de preferință pentru un laborator mare și un furnizor european care rulează evaluări de siguranță pentru un alt laborator. Ambii au fost găsiți căutând pe LinkedIn roluri etichetate Analist Date Part Time cu cuvinte cheie date preferință sau RLHF, apoi aplicând direct. Pentru strategia completă de găsire a muncii discrete pe care nimeni nu o publică, hub-ul Freelance are întregul plan.

  1. Căutare LinkedIn: filtrează după part time, contract, remote; cuvinte cheie RLHF, adnotare AI, date preferință, rater.
  2. Pagini de companie: identifică 8 până la 12 furnizori de nișă, urmărește-i, aplică la orice rol de evaluator care se deschide.
  3. Screening: așteaptă-te la o sarcină scrisă neplătită de 90 de minute, de obicei 4 până la 6 exerciții de clasificare.
  4. Interviu: un apel de 20 până la 30 de minute cu un manager de program. Non-tehnic, axat pe gândirea bazată pe barem.
  5. Lot de calificare plătit: 2 până la 5 ore de muncă plătită, evaluată față de standarde interne. Treci și ești înăuntru.

Banii, fără exagerări

Pe cele două contracte ale mele, tarifele au fost de 18 și respectiv 22 de euro pe oră. Termenii de plată au fost net 15 pentru primul furnizor și net 30 pentru al doilea, ambii prin transfer bancar SEPA cu facturare TVA pe statutul meu de micro-întreprindere. Volumul a variat enorm; într-o lună am înregistrat 41 de ore plătite, în luna următoare șapte. Tratează-l ca un venit cu tarif ridicat și fiabilitate scăzută și funcționează. Tratează-l ca un înlocuitor de salariu și îți va destabiliza bugetul.

Pentru comparația cu alte surse freelance pe care le rulez în paralel, articolul Prolific vs Userlytics este lectura complementară. Pentru mentalitatea din spatele combinării mai multor surse mici de venit astfel încât niciuna să nu fie nevoită să le suporte pe celelalte, articolul despre aplicații de dividende aplică aceeași logică pe o sursă diferită.

Semnalele de alarmă care mi-au costat timp

Am aplicat la unsprezece furnizori înainte de prima ofertă. Trei erau escrocherii sau adiacente MLM, doi nu au răspuns niciodată, patru m-au pus printr-un screening și au dispărut. Ceilalți doi au plătit. Semnalele de alarmă pe care le filtrez acum imediat: screenere neplătite mai lungi de două ore, tarife publicate peste 40 de dolari pe oră pentru evaluatori generaliști, orice furnizor care cere o plată de test sau o verificare de credit și orice rol care te obligă să plătești pentru un curs de formare. Furnizorii legitimi plătesc lotul de calificare, de fiecare dată.

Sfatul rar al lui John

Scrie o evaluare eșantion clară, apoi reutilizeaz-o

Screenere-le cer aproape întotdeauna să clasifici două răspunsuri ale unui model și să justifici clasificarea. Am scris un șablon de evaluare de 180 de cuvinte, structurat ca ce a cerut promptul, cum a tratat fiecare răspuns cererea, de ce clasific A înaintea lui B. Reutilizarea acestei structuri la fiecare screening mi-a redus timpul de scriere a screeningului de la 90 de minute la 40 de minute și m-a plasat deasupra barei la patru din cinci aplicații.

Ce aș evita

Nu semna un NDA fără a citi clauza de non-concurență. Un furnizor mi-a oferit un contract de 24 de euro pe oră care m-ar fi exclus din orice altă muncă de adnotare AI timp de 12 luni după încheierea contractului. Am refuzat, am acceptat oferta de 18 euro pe oră care nu avea o astfel de clauză și am păstrat opțiunea de a adăuga un al doilea contract șase luni mai târziu. Flexibilitatea a meritat cei 6 euro în minus.

Întrebări frecvente

Am nevoie de un background tehnic pentru a evalua răspunsurile AI?

Nu, dar ai nevoie de scriere clară în engleză și un ochi atent pentru nuanțe. Experiența mea este în trading sportiv, nu în machine learning, și am trecut testul de screening la a doua încercare. Ceea ce contează cu adevărat este capacitatea de a justifica o evaluare într-un paragraf curat.

Cât durează de la aplicare până la prima sarcină plătită?

Trei până la șase săptămâni din experiența mea. Procesul de onboarding trece printr-un recrutor, un test scris, un scurt interviu și un lot de calificare plătit. Orice durată mai scurtă de trei săptămâni este de obicei un program cu tarif mai mic față de care ar trebui să fii sceptic.

Este venitul suficient de stabil pentru a planifica în jurul lui?

Nu lunar. Programele cresc și scad în valuri de patru până la opt săptămâni. Am văzut 30 de ore pe săptămână oferite și apoi zero timp de două săptămâni. Tratează-l ca un venit cu tarif ridicat și fiabilitate scăzută, nu ca un salariu.