تم الكشف عن أقوى نموذج o3 من OpenAI للاحتيال، حيث حصل على وصول مميز إلى بنك أسئلة اختبار FrontierMath مسبقًا
كشف مقاول من EpochAI يُدعى "ميمي" على منتدى Less Wrong أن OpenAI لم تقدم فقط الدعم المالي لاختبار معيار FrontierMath، بل حصلت أيضًا على وصول مميز إلى بنك أسئلة الاختبار.
اعترف تاماي بيسيروغلو، نائب المدير وأحد المؤسسين المشاركين لـ EpochAI، بذلك قريبًا على المنصة X. لقد ارتكبنا خطأ بعدم الكشف عن مشاركة OpenAI في FrontierMath في وقت سابق. كان عقدنا يمنعنا من القيام بذلك قبل إصدار o3. بالنظر إلى الوراء، كان ينبغي علينا أن نسعى جاهدين لتحقيق الشفافية في وقت أقرب. نحن نعترف بذلك ونتعهد بأن نكون أفضل في المستقبل.
اعترف إليوت جليزر، كبير علماء الرياضيات في EpochAI، بأنه لم يكشف بشكل استباقي عن معلومات حول تمويل الصناعة خلال المشروع واعتذر للرياضيين الذين ربما لم يشاركوا لو كانوا يعلمون مسبقًا. فيما يتعلق بنتائج o3، أعرب عن ثقته في دقة النتائج التي أبلغت عنها OpenAI لكنه أكد أن EpochAI بحاجة إلى التحقق من خلال مجموعة اختبار احتفاظ مستقلة قيد التطوير ووعد بأن يتم الإعلان عن نتائج التقييم من هذه المجموعة. وعندما سئل عن حالة هذه المجموعة الاحتفاظية، أوضح جليزر أنها لا تزال قيد التطوير وليست مكتملة.
يُذكر أن FrontierMath هو معيار تقييم لقدرة التفكير الرياضي المتقدم ذو وزن كبير. تم إنشاؤه بشكل مشترك من قبل EpochAI بمشاركة أكثر من 60 من كبار علماء الرياضيات بما في ذلك العديد من الفائزين بميدالية فيلدز ومعدي المسائل ذوي الخبرة في مسابقات الأولمبياد الرياضي الدولي.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like

GAIN الرسمي: جارٍ التحقيق في مشكلة الإصدار غير الطبيعي
البيانات: تلقت 10 عناوين ما مجموعه 210,000 ETH خلال 6 ساعات، بقيمة تقارب 863 millions دولار أمريكي.