كيف حصلت على عقدَي تقييم ذكاء اصطناعي دون شهادة تقنية

لابتوب مع بطاقات مقارنة جنباً إلى جنب ومعايير لعمل RLHF ومقيّم الذكاء الاصطناعي

عمل تقييم الذكاء الاصطناعي هو أهدأ مسار مدفوع في المنظومة. اكتشفته بالصدفة في مطلع 2024، وبنهاية العام كنت قد جمعت ما يزيد قليلاً على 4,300 يورو عبر وكالتَين متخصصتَين. لا أحد في منتديات المهام الصغيرة الرئيسية يتحدث عنه، لأن من يدخله يميل إلى إبقائه لنفسه.

ما هو هذا العمل فعلاً

من الناحية العملية، تقرأ طلباً، تقرأ نموذجَين أو ثلاثة من الإجابات، ثم تُرتّبها وفق معيار تقييم. أحياناً تكتب نسخة أفضل بنفسك. أحياناً تُحدّد أي الإجابتَين أكثر أماناً أو دقة أو فائدة. أنواع المهام التي تعاملت معها: ترتيب التفضيلات، التحقق من الوقائع، تصنيف السلامة، وإعادة الصياغة. لا شيء منها يتطلب خلفية تقنية. جميعها تتطلب إنجليزية كتابية واضحة والقدرة على تبرير التقييم في جملتَين إلى أربع جمل دون حشو.

من أين تأتي هذه الوظائف فعلاً

ليس من المنصات الرئيسية الكبرى. العقدان اللذان حصلت عليهما جاءا عبر وكالات متخصصة تعمل وسيطاً بين مختبرات الذكاء الاصطناعي والمُقيّمين الأفراد. فكّر فيها كوكالات توظيف. في حالتي: وكالة مقرّها المملكة المتحدة تتعامل مع بيانات التفضيلات لمختبر كبير، ووكالة أوروبية تُجري تقييمات السلامة لمختبر آخر. وجدتهما بالبحث على LinkedIn عن وظائف مُصنَّفة Data Analyst Part Time مع كلمات مفتاحية مثل preference data أو RLHF، ثم التقدم مباشرة. للاستراتيجية الشاملة في إيجاد العمل الهادئ الذي لا يُعلَن عنه، يضم محور الفريلانس خطتي الكاملة.

  1. البحث على LinkedIn: فلتر بدوام جزئي، عقد، عن بُعد؛ كلمات مفتاحية RLHF, AI annotation, preference data, rater.
  2. صفحات الشركات: حدّد 8 إلى 12 وكالة متخصصة، تابعها، تقدّم لأي وظيفة تقييم تفتح.
  3. الاختبار: توقّع مهمة كتابية غير مدفوعة مدتها 90 دقيقة، عادةً 4 إلى 6 تمارين ترتيب.
  4. المقابلة: مكالمة 20 إلى 30 دقيقة مع مدير برنامج. غير تقنية، تركّز على التفكير المعياري.
  5. دفعة التأهيل المدفوعة: 2 إلى 5 ساعات من العمل المدفوع تُقيَّم وفق معايير داخلية. اجتزها وأنت داخل.

المال، بعيداً عن المبالغة

على عقدَيّ، استقرت الأسعار عند 18 و22 يورو في الساعة على التوالي. شروط الدفع كانت 15 يوماً صافية للوكالة الأولى و30 يوماً للثانية، كلاهما عبر تحويل بنكي SEPA مع فاتورة ضريبة القيمة المضافة بموجب وضعي كمقاول ذاتي. الحجم تفاوت تفاوتاً كبيراً؛ في شهر سجّلت 41 ساعة مدفوعة، وفي الشهر التالي سبع ساعات. عامله كمسار عالي المعدل ومنخفض الموثوقية وسيعمل. عامله كبديل للراتب وسيكسر ميزانيتك.

للمقارنة مع مسارات الفريلانس الأخرى التي أجريها بالتوازي، مقالة Prolific مقابل Userlytics هي القراءة المصاحبة. لمنطق تراكم عدة مصادر دخل صغيرة بحيث لا يضطر أي منها لحمل العبء وحده، مقالة تطبيقات الأرباح الموزّعة تطبّق المنطق ذاته على مسار مختلف.

العلامات التحذيرية التي أضاعت وقتي

تقدّمت إلى أحد عشر وكالة قبل عرضي الأول. ثلاث منها كانت عمليات نصب أو قريبة من التسويق الشبكي، واثنتان لم تردّا أبداً، وأربع أجرتني اختبار ترشيح ثم اختفت. الاثنتان المتبقيتان دفعتا. العلامات التحذيرية التي أُصفّيها فوراً الآن: اختبارات غير مدفوعة تتجاوز ساعتَين، أسعار مُعلَنة تتجاوز 40 دولاراً في الساعة لمُقيّمين عامّين، أي وكالة تطلب دفعة تجريبية أو كشف حساب، وأي وظيفة تشترط شراء دورة تدريبية. الوكالات الشرعية تدفع دفعة التأهيل دائماً.

نصيحة جون النادرة

اكتب تقييماً نموذجياً واحداً واضحاً، ثم أعد استخدامه

تطلب اختبارات الترشيح دائماً تقريباً ترتيب مخرجَي نموذج وتبرير ترتيبك. كتبت قالب تقييم واحداً، 180 كلمة، منظّم كـ"ما الذي طلبه الطلب، كيف تعاملت كل إجابة معه، لماذا أُرتّب أ قبل ب". إعادة استخدام هذا الهيكل في كل اختبار قلّصت وقت الكتابة من 90 دقيقة إلى 40 دقيقة، وحقّقت درجة فوق المعيار في أربعة من خمسة طلبات.

ما الذي سأتجنبه

لا توقّع اتفاقية عدم إفصاح دون قراءة بند عدم المنافسة. عرضت عليّ إحدى الوكالات عقداً بـ24 يورو في الساعة كان سيحظر عليّ أي عمل آخر في مجال التوصيف بالذكاء الاصطناعي لمدة 12 شهراً بعد انتهاء العقد. انسحبت، وقبلت العرض بـ18 يورو في الساعة الذي لم يتضمن مثل هذا البند، وحافظت على خيار تراكم عقد ثانٍ بعد ستة أشهر. المرونة كانت تستحق الـ6 يورو.

أسئلة شائعة

هل أحتاج إلى خلفية تقنية لتقييم مخرجات الذكاء الاصطناعي؟

لا، لكنك تحتاج إلى كتابة واضحة بالإنجليزية وعين صبورة للتمييز. خلفيتي في تداول الرياضة، لا في تعلم الآلة، واجتزت الاختبار في المحاولة الثانية. ما يهم فعلاً هو القدرة على تبرير التقييم في فقرة واحدة واضحة.

كم يستغرق الأمر من التقديم حتى أول مهمة مدفوعة؟

من ثلاثة إلى ستة أسابيع من تجربتي. تمر عملية التأهيل عبر مُجنّد، ثم اختبار كتابي، ثم مقابلة قصيرة، ثم دفعة تأهيل مدفوعة. أي شيء أسرع من ثلاثة أسابيع هو عادةً برنامج منخفض الأجر ينبغي الشك فيه.

هل الدخل مستقر بما يكفي للتخطيط عليه؟

لا على أساس شهري. ترتفع البرامج وتنخفض في موجات تمتد من أربعة إلى ثمانية أسابيع. رأيت 30 ساعة في الأسبوع تُعرض ثم صفراً لمدة أسبوعَين. عامله كمسار عالي المعدل ومنخفض الموثوقية، لا كراتب.