البشر في تطور الذكاء الاصطناعي؟ زائدة عن الحاجة 🤯 تم اختبار طريقة التدريس الذاتي
في جميع الحالات التي وصل فيها الذكاء الاصطناعي إلى قدرات خارقة، أصبحت التجربة البشرية قديمة. AlphaZero (DeepMind): أتقن لعب الشطرنج ضد نفسه، وملايين الألعاب، ومستوى خارق في ساعات!
استخدامات تدريب LLM الحالية بشري استجابات لإنشاء نماذج المكافآت. ولكن لماذا نحتاج إلى البشر إذا كان الهدف هو رفع القدرات اللغوية لـ LLM إلى جبار المستويات؟ 🤔
الحل؟ تقوم LLMs ذات الاكتفاء الذاتي بإنشاء نماذج المكافآت الخاصة بها والتي «يتم استخدامها في حد ذاتها عبر LLM-as-a-judge للمطالبة بتقديم مكافآتها الخاصة أثناء التدريب». تم اختبار هذه الطريقة على Llama 2 70B، وتفوقت هذه الطريقة على معظم الأنظمة، بما في ذلك Claude 2 و Gemini Pro و GPT-4 (تقرير)
ما هو الشيء الرائع؟ هذا يجلب التكهنات حول «ليس هناك حاجة للأشخاص لتحسين الذات في LLM» إلى واقع عملي [لأول مرة، على ما أعتقد]
لذلك، في يوم من الأيام بلاسي سوف يدعو بلاسي برو إلى دورة علم النفس، وستقوم بدورها بدعوة أختها للتدريب على المبيعات 😀




