tgoop.com/robo_khabar/2481
Last Update:
🔴 سختترین امتحان تاریخ برای هوش مصنوعی
🔸 محققان مرکز ایمنی هوش مصنوعی (CAIS) و Scale AI آزمونی جدید به نام "آخرین آزمون بشریت" طراحی کردهاند که به عنوان سختترین تست تاریخ برای مدلهای هوش مصنوعی شناخته میشود. این آزمون شامل ۳,۰۰۰ سؤال چندگزینهای است که توسط ۱,۰۰۰ دانشمند از ۵۰ کشور و حوزههای مختلف، از فلسفه تحلیلی و ریاضیات پیشرفته تا مهندسی موشکی طراحی شدهاند.
📊 نتایج آزمون و عملکرد مدلها
این آزمون توسط ۶ مدل هوش مصنوعی انجام شد، اما هیچیک نتوانستند امتیازی بالاتر از ۱۰٪ کسب کنند:
🏆 مدل DeepSeek-R1 با ۹.۴٪ بالاترین نمره را کسب کرد، اما به دلیل ناتوانی در پردازش تصاویر برخی سؤالات را حل نکرد.
🏆 مدل OpenAI-o1 با ۹.۱٪ در جایگاه دوم قرار گرفت.
به گفته محققان، این مدلها تا پایان سال ۲۰۲۵ احتمالاً به دقت بالای ۵۰٪ خواهند رسید.
🔸 کوین ژو، فیزیکدان دانشگاه برکلی ، معتقد است:
"قبولی در یک امتحان، با توانایی انجام تحقیقات علمی فاصله زیادی دارد. حتی یک AI که بتواند به این سؤالات پاسخ دهد، ممکن است هنوز برای کارهای پژوهشی آماده نباشد."
📍روبوخبر📍
🆔 @robo_khabar
BY روبوخبر | Robokhabar

Share with your friend now:
tgoop.com/robo_khabar/2481