기술 학위 없이 AI 레이터 계약 두 건을 딴 방법

나란히 놓인 비교 카드와 채점 기준이 있는 노트북 — RLHF 및 AI 평가 작업용

AI 레이터 일은 이 생태계에서 가장 조용하면서도 잘 쳐주는 마이크로태스크 레일이다. 2024년 초에 우연히 알게 됐고, 연말까지 소형 벤더 두 곳에서 4,300유로(약 645만 원) 남짓을 벌었다. 주류 마이크로태스크 포럼에서 아무도 이야기하지 않는 건, 진입한 사람들이 조용히 혼자 쥐고 있기 때문이다.

실제로 하는 일

실무는 이렇다. 프롬프트 하나를 읽고, 모델 답변 두세 개를 읽고, 루브릭에 맞춰 순위를 매긴다. 때로는 더 나은 버전을 직접 쓰기도 한다. 때로는 두 답변 중 어느 쪽이 더 안전하거나, 더 사실적이거나, 더 유용한지를 주석으로 단다. 내가 다룬 과제 유형은 선호도 랭킹, 팩트체크, 안전성 라벨링, 리라이팅이었다. 어느 것도 기술 배경을 요구하지 않았다. 모두 명확한 영어 글쓰기와 평가 이유를 2~4문장으로 군더더기 없이 정당화하는 능력이 필요했다.

일이 실제로 오는 곳

대형 주류 플랫폼이 아니다. 내가 딴 계약 두 건은 AI 랩과 개별 레이터 사이를 잇는 중개인 역할을 하는 소형 벤더를 통해 들어왔다. 일종의 인력 에이전시라고 보면 된다. 내 경우 하나는 대형 랩의 선호도 데이터를 처리하는 영국 기반 벤더, 다른 하나는 다른 랩의 안전성 평가를 운영하는 유럽 벤더였다. 둘 다 LinkedIn에서 *Data Analyst Part Time* 태그에 *preference data* 또는 *RLHF* 키워드로 검색해 직접 지원해서 찾았다. 아무도 광고하지 않는 조용한 일을 찾는 더 넓은 플레이북은 프리랜스 허브에 전체 전략이 있다.

LinkedIn 검색: 파트타임, 계약직, 원격으로 필터; 키워드 *RLHF*, *AI annotation*, *preference data*, *rater*.
회사 페이지: 소형 벤더 8~12곳을 식별, 팔로우, 레이터 포지션이 열리면 지원.
스크리너: 90분짜리 무급 서면 과제, 보통 4~6개의 랭킹 연습을 예상하라.
인터뷰: 프로그램 매니저와 20~30분 통화. 기술 질문이 아니라 루브릭 사고 중심.
유급 자격 배치: 2~5시간의 유급 작업을 내부 벤치마크로 채점한다. 통과하면 합격.

과장을 걷어낸 돈 이야기

내 두 계약의 단가는 각각 시급 18유로와 22유로였다. 결제 조건은 첫 번째 벤더가 net 15, 두 번째가 net 30이었고, 둘 다 SEPA 은행 송금에 micro entreprise 지위로 VAT 인보이스를 발행했다. 한국 거주자라면 원화 환산 기준 약 2.7만~3.3만 원 시급이고, 결제는 해외 송금 또는 Wise/Payoneer를 통해 원화 입금으로 돌리게 된다. 볼륨은 크게 들쭉날쭉했다. 어떤 달은 유급 41시간, 다음 달은 7시간이었다. 고단가·저안정성 레일로 다루면 작동한다. 월급 대체로 다루면 예산이 깨진다.

병행하는 다른 프리랜스 레일과의 비교는 Prolific 대 Userlytics 글이 동반 독서다. 하나의 수입원이 모든 걸 지탱하지 않도록 여러 작은 수입 흐름을 층층이 쌓는 사고방식은, 다른 레일에 같은 논리를 적용한 배당 앱 글에 담겨 있다.

시간을 날린 레드 플래그

첫 오퍼가 오기 전에 열한 개 벤더에 지원했다. 셋은 사기 또는 MLM 성격이었고, 둘은 답이 없었으며, 넷은 스크리너를 시키고 잠적했다. 나머지 둘이 돈을 냈다. 지금은 즉시 걸러내는 레드 플래그는 이렇다: 2시간을 넘는 무급 스크리너, 일반 레이터에게 시급 40달러 이상을 광고하는 경우, 테스트 결제나 신용 조회를 요구하는 벤더, 교육 코스 비용을 내라는 역할. 정당한 벤더는 언제나 자격 배치에 돈을 낸다.

존의 숨은 팁

깔끔한 평가 샘플을 한 번 쓰고, 재활용하라

스크리너는 거의 항상 두 모델 출력에 순위를 매기고 그 이유를 쓰라고 한다. 나는 180단어짜리 템플릿 평가를 하나 썼다. 구조는 *프롬프트가 요구한 것, 각 답변이 그것을 어떻게 다뤘는지, 왜 A를 B 위에 두는지*였다. 그 구조를 모든 스크리너에서 재사용해 작성 시간을 90분에서 40분으로 줄였고, 다섯 개 지원 중 네 개에서 합격선 위로 올라갔다.

내가 피할 것

비경쟁 조항을 읽지 않고 NDA에 서명하지 마라. 한 벤더는 시급 24유로 계약을 제시했는데, 계약 종료 후 12개월간 다른 어떤 AI 어노테이션 일도 할 수 없는 조항이 붙어 있었다. 나는 거기서 손을 떼고, 그런 조항이 없는 시급 18유로 오퍼를 택했다. 덕분에 6개월 뒤 두 번째 계약을 추가로 쌓을 선택지를 지켰다. 그 유연성은 시급 6유로 차이 값어치가 있었다.

자주 묻는 질문

AI 출력 평가에 기술 배경이 필요한가?

아니다. 그러나 명확한 영어 글쓰기와 뉘앙스를 잡는 인내심 있는 눈이 필요하다. 내 배경은 스포츠 트레이딩이지 머신러닝이 아니고, 스크리너를 두 번째 시도에 통과했다. 중요한 것은 평가 이유를 한 문단으로 깔끔하게 정당화하는 능력이다.

지원에서 첫 유급 과제까지 얼마나 걸리나?

내 경험상 3~6주. 온보딩은 리크루터, 서면 스크리너, 짧은 인터뷰, 그리고 유급 자격 배치로 이어진다. 3주보다 빠르다면 보통 더 낮은 급여의 프로그램이고, 경계해야 한다.

월 단위로 계획을 세울 만큼 수입이 안정적인가?

월 단위로는 아니다. 프로그램은 4~8주 파도로 올라갔다가 꺾인다. 주 30시간이 제시되다가 2주간 0이 되기도 했다. 월급이 아니라 고단가·저안정성 레일로 다뤄야 한다.

기술 학위 없이 AI 레이터 계약 두 건을 딴 방법

실제로 하는 일

일이 실제로 오는 곳

과장을 걷어낸 돈 이야기

시간을 날린 레드 플래그

깔끔한 평가 샘플을 한 번 쓰고, 재활용하라

자주 묻는 질문

계속 읽기

Prolific 대 Userlytics, 실제 시급

니치 전사, 의료와 법률

소액 자본을 위한 배당 앱