EXTENDED (SUR)REALITY@extended

EXTENDED (SUR)REALITY

Пока все тестировали новую «рассуждающую» модель o1 от OpenAI, Scale AI и Center of AI Safety объявили о проведении конкурса под завораживающим названием «Последний экзамен человечества» («Humanity Last Exam»).

Основная задача конкурса - собрать самые сложные вопросы для оценки работы будущих систем ИИ. Раз текущие модели пугают нас своей способностью за час написать код PhD-исследования, необходимо разработать тесты, решить которые им будет уже не под силу.

В рамках конкурса принимаются вопросы, затрагивающие самые разные области знания - от математики и логики до аналитической философии (судя по текущим заявкам, философских вопросов пока не так много).

Требования к вопросам следующие: высокая сложность, оригинальность, безопасность (никаких вопросов про изготовление атомной бомбы), объективность (вопросы про смысл жизни, вселенной и всего такого тоже не принимаются).

После того, как вы записали ваш вопрос, его предварительно проверяют на современных языковых моделях, чтобы определить, не является ли он слишком простым.

За топ-500 лучших вопросов обещают денежные призы, а авторов самых сложных заданий могут также упомянуть в итоговой научной статье.

Я уже задала свой вопрос.
Вам тоже рекомендую подумать над своим в качестве интеллектуальной разминки.

#future
#philosophy

www.tgoop.com/extended_surreality/364

3.4K viewsSep 17 at 06:24

tgoop.com/extended_surreality/364

Create: 2024-09-17
Last Update: 2024-12-19 11:15:12

BY EXTENDED (SUR)REALITY

Share with your friend now:
tgoop.com/extended_surreality/364

Telegram News

Пока все тестировали новую «рассуждающую» модель o1 от OpenAI