Comment j'ai décroché deux contrats d'évaluateur IA sans diplôme technique

Laptop with side-by-side comparison cards and rubric for RLHF and AI rater work

L'évaluation d'IA est le rail de microtâches bien payées le plus discret de l'écosystème. Je suis tombé dessus par hasard début 2024, et avant la fin de l'année j'avais encaissé un peu plus de 4 300 euros auprès de deux prestataires de niche. Personne sur les forums grand public ne l'évoque, parce que ceux qui réussissent à entrer ont tendance à garder le secret.

En quoi consiste concrètement ce travail

En pratique, vous lisez un prompt, vous lisez deux ou trois réponses générées par un modèle, et vous les classez selon une grille d'évaluation. Parfois vous écrivez vous-même une meilleure version. Parfois vous annotez laquelle de deux réponses est plus sûre, plus exacte ou plus utile. Les types de tâches que j'ai traités : classement de préférences, vérification de faits, étiquetage de sécurité, et réécriture. Aucun n'exigeait de profil technique. Tous exigeaient une bonne expression écrite et la capacité à justifier une note en deux à quatre phrases sans tourner autour du pot.

D'où viennent réellement ces missions

Pas des grandes plateformes grand public. Les deux contrats que j'ai décrochés sont passés par des prestataires de niche qui servent d'intermédiaires entre les laboratoires d'IA et les évaluateurs individuels. Pensez à eux comme à des agences de recrutement spécialisées. Dans mon cas : un prestataire basé au Royaume-Uni qui gère des données de préférence pour un grand laboratoire, et un prestataire européen qui conduit des évaluations de sécurité pour un autre laboratoire. Les deux ont été trouvés en cherchant sur LinkedIn des postes étiquetés Data Analyst temps partiel avec les mots-clés preference data ou RLHF, puis en postulant directement. Pour la stratégie complète pour trouver ce type de travail peu visible, le hub Freelance contient ma méthode complète.

  1. Recherche LinkedIn : filtrer sur temps partiel, contrat, télétravail ; mots-clés RLHF, AI annotation, preference data, rater.
  2. Pages entreprises : identifier 8 à 12 prestataires de niche, les suivre, postuler à tout poste d'évaluateur qui s'ouvre.
  3. Test de sélection : prévoir une tâche écrite non rémunérée de 90 minutes, généralement 4 à 6 exercices de classement.
  4. Entretien : un appel de 20 à 30 minutes avec un responsable de programme. Non technique, axé sur la réflexion selon la grille d'évaluation.
  5. Lot de qualification rémunéré : 2 à 5 heures de travail payé noté selon des références internes. Réussissez-le et vous êtes intégré.

L'argent, sans fioritures

Sur mes deux contrats, les taux se situaient à 18 et 22 euros de l'heure respectivement. Les conditions de paiement étaient à 15 jours pour le premier prestataire et à 30 jours pour le second, tous deux par virement SEPA avec facturation TVA sur mon statut de micro-entrepreneur. Le volume variait énormément ; un mois j'ai enregistré 41 heures payées, le mois suivant sept. Traitez-le comme un rail à taux élevé et peu fiable, et ça fonctionne. Traitez-le comme un substitut de salaire et il cassera votre budget.

Pour la comparaison avec les autres rails freelance que je gère en parallèle, l'article Prolific vs Userlytics est la lecture complémentaire. Pour la philosophie consistant à superposer plusieurs petites sources de revenus afin qu'aucune n'ait à tout porter, l'article sur les apps de dividendes applique la même logique sur un rail différent.

Les signaux d'alarme qui m'ont coûté du temps

J'ai postulé chez onze prestataires avant ma première offre. Trois étaient des arnaques ou proches du MLM, deux n'ont jamais répondu, quatre m'ont fait passer un test puis ont disparu. Les deux restants ont payé. Signaux d'alarme que je filtre désormais immédiatement : tests de sélection non rémunérés de plus de deux heures, taux annoncés au-dessus de 40 euros de l'heure pour des évaluateurs généralistes, tout prestataire qui demande un paiement test ou une vérification de solvabilité, et tout poste exigeant de payer une formation. Les prestataires légitimes rémunèrent le lot de qualification, sans exception.

Le conseil rare de John

Rédigez un exemple d'évaluation propre, puis réutilisez-le

Les tests de sélection vous demandent presque toujours de classer deux sorties de modèle et de justifier votre classement. J'ai rédigé un modèle d'évaluation, 180 mots, structuré ainsi : ce que le prompt demandait, comment chaque réponse l'a traité, pourquoi je classe A avant B. Réutiliser cette structure sur chaque test a réduit mon temps de rédaction de 90 minutes à 40 minutes, et m'a fait passer la barre sur quatre candidatures sur cinq.

Ce que j'éviterais

Ne signez pas un NDA sans lire la clause de non-concurrence. Un prestataire m'a proposé un contrat à 24 euros de l'heure qui m'aurait interdit tout autre travail d'annotation IA pendant 12 mois après la fin du contrat. J'ai décliné, accepté l'offre à 18 euros de l'heure sans cette clause, et conservé la possibilité d'empiler un second contrat six mois plus tard. La flexibilité valait les 6 euros de différence.

Questions fréquentes

Faut-il un profil technique pour évaluer des productions d'IA ?

Non, mais vous avez besoin d'une bonne capacité rédactionnelle et d'un œil attentif aux nuances. Mon parcours est celui d'un trader sportif, pas d'un expert en machine learning, et j'ai réussi le test de sélection à la deuxième tentative. Ce qui compte vraiment, c'est la capacité à justifier une note en un paragraphe propre.

Combien de temps entre la candidature et la première tâche payée ?

Trois à six semaines selon mon expérience. Le processus d'intégration passe par un recruteur, un test écrit, un court entretien, puis un lot de qualification rémunéré. Tout ce qui est plus rapide que trois semaines est généralement un programme moins bien payé dont il faut se méfier.

Le revenu est-il assez stable pour s'organiser autour ?

Pas à l'échelle mensuelle. Les programmes se lancent et s'arrêtent par vagues de quatre à huit semaines. J'ai vu 30 heures par semaine proposées, puis zéro pendant deux semaines. Considérez-le comme un rail à taux élevé mais peu fiable, pas comme un salaire.