FUTURIS Telegram 3038
Представлен "Последний экзамен человечества" от CAIS и Scale AI: новый бенчмарк из 3000 сложнейших вопросов по более чем 100 предметам. Созданный почти 1000 экспертами из 500+ учреждений в 50 странах, HLE призван оценить предел возможностей ИИ, поскольку существующие тесты (MMLU) покорились моделям с точностью выше 90%. Первые результаты шокируют: даже GPT-4o показал всего 3.3% точности, а лучший результат – 9.4% принадлежит китайской R1. Организаторы считают HLE ключевым инструментом для измерения прогресса ИИ и прогнозируют достижение 50% точности к концу 2025 года. Издания New York Times и Reuters уже назвали HLE важным этапом в развитии искусственного интеллекта👌

Делаем ставки как быстро этот "экзамен" покорят нейронки

https://agi.safe.ai/



tgoop.com/Futuris/3038
Create:
Last Update:

Представлен "Последний экзамен человечества" от CAIS и Scale AI: новый бенчмарк из 3000 сложнейших вопросов по более чем 100 предметам. Созданный почти 1000 экспертами из 500+ учреждений в 50 странах, HLE призван оценить предел возможностей ИИ, поскольку существующие тесты (MMLU) покорились моделям с точностью выше 90%. Первые результаты шокируют: даже GPT-4o показал всего 3.3% точности, а лучший результат – 9.4% принадлежит китайской R1. Организаторы считают HLE ключевым инструментом для измерения прогресса ИИ и прогнозируют достижение 50% точности к концу 2025 года. Издания New York Times и Reuters уже назвали HLE важным этапом в развитии искусственного интеллекта👌

Делаем ставки как быстро этот "экзамен" покорят нейронки

https://agi.safe.ai/

BY Futuris


Share with your friend now:
tgoop.com/Futuris/3038

View MORE
Open in Telegram


Telegram News

Date: |

The Standard Channel How to create a business channel on Telegram? (Tutorial) Telegram desktop app: In the upper left corner, click the Menu icon (the one with three lines). Select “New Channel” from the drop-down menu. So far, more than a dozen different members have contributed to the group, posting voice notes of themselves screaming, yelling, groaning, and wailing in various pitches and rhythms. Earlier, crypto enthusiasts had created a self-described “meme app” dubbed “gm” app wherein users would greet each other with “gm” or “good morning” messages. However, in September 2021, the gm app was down after a hacker reportedly gained access to the user data.
from us


Telegram Futuris
FROM American