ميتا تكشف عن نموذج المقيم الذاتي التعليمى وتطلق Spirit LM لتقليد الأصوات البشرية
كشفت شركة ميتا عن نموذج ذكاء اصطناعي جديد يحمل اسم (المقيم الذاتي التعليم Self-Taught Evaluator)، الذي يهدف إلى تقييم نماذج الذكاء الاصطناعي الأخرى وتدريبها بنحو مستقل دون تدخل بشري.
ويهدف النموذج الجديد من ميتا إلى إلغاء الحاجة إلى التدخل البشري، إذ يتميز بقدرته على تدريب نماذج الذكاء الاصطناعي الأخرى وتقييمها دون الاستعانة بالخبرات البشرية، إلى جانب اعتماده على تقنية “سلسلة الأفكار” (Chain of Thought) التي استخدمتها شركة OpenAI في نماذج o1 التي طرحتها حديثا، والتي تهدف إلى تقسيم المشكلات المعقدة إلى خطوات منطقية أصغر، مما يؤدي إلى تحسين دقة الإجابات في مجالات متقدمة مثل العلوم والبرمجة والرياضيات.
ويستخدم المطورون تقنية تعرف باسم “التعلم التعزيزي من خلال ملاحظات البشر” (RLAIF) خلال عملية التدريب، وهي عملية تتطلب تدخل البشر، مما يبطئ سرعة عملية تطوير النماذج.
وقال جيسون ويستون، أحد الباحثين المشاركين في المشروع: “نأمل أنه مع تطور الذكاء الاصطناعي وتفوقه على البشر أن يصبح أكثر كفاءة في فحص أعماله، وأفضل من الأداء البشري المتوسط”.
يشار إلى أن ميتا طورت نموذج “المقيم الذاتي التعليم” باستخدام تقنية “سلسلة الأفكار” ذاتها، ودربته باستخدام بيانات ولدها الذكاء الاصطناعي.
كما أطلقت شركة ميتا نموذجها الجديد Spirit LM المفتوح المصدر، الذي يعنى بمعالجة التحديات المتعلقة بالنماذج المتعددة الوسائط في الذكاء الاصطناعي في توليد الأصوات، وتقليد الأصوات البشرية.
ويعتمد نموذج “Spirit LM” على نموذج لغوي مدرب سابقا يحتوي على 7 مليارات معلمة، ويتميز بقدرته على معالجة الصوت بنحو مختلف عن النماذج التقليدية التي تعتمد على تقنيات تعرف الكلام تلقائيا (ASR).
ويهدف النموذج الجديد إلى تقديم تجربة صوتية طبيعية وأكثر تعبيرا، مما يشكل خطوة متقدمة في تطوير الروبوتات الذكية القادرة على التواصل الصوتي بنحو أكثر تعقيدا وواقعية.
وأشارت ميتا إلى أن النهج التقليدي يؤدي إلى فقدان الكثير من التعبيرات الطبيعية في الصوت، ولذلك، يعتمد “Spirit LM” على استخدام رموز الفونيم (الوحدات الصوتية) والنغمات ودرجات الصوت لتجاوز هذه القيود، مما يمكنه من إنتاج أصوات طبيعية، والتعلم من مهام جديدة تشمل تعرف الكلام، وتحويل النص إلى صوت، وتصنيف الكلام.
ويتوفر النموذج الآن كمشروع مفتوح المصدر للمطورين والباحثين لاستخدامه وتطويره، ويتوقع أن يستخدم مستقبلا ضمن تطبيقات ميتا مثل واتسآب وإنستغرام وفيسبوك، مما يتيح للمستخدمين التفاعل مع الذكاء الاصطناعي عبر محادثات صوتية طبيعية مليئة بالتعبيرات على غرار الوضع الصوتي المتقدم الذي قدمته شركة OpenAI حديثا.