BLOCKCHAINRF Telegram 11141
❗️OpenAI и FrontierMath: Большой скандал о прозрачности в ИИ, на который нужно обратить внимание

Разгорелся серьезный скандал вокруг одного из ключевых инструментов оценки математических способностей языковых моделей - бенчмарка FrontierMath.

Выяснилось, что OpenAI тайно финансировала его разработку и имела эксклюзивный доступ к данным.

Компания Epoch AI, создатель бенчмарка FrontierMath, признала, что была связана соглашением о неразглашении с OpenAI, которое запрещало раскрывать информацию об их партнерстве до запуска модели GPT-4 Turbo (o3). При этом математики, создававшие задачи для бенчмарка, не знали об участии OpenAI в проекте.

Epoch AI публично признала ошибку в обеспечении прозрачности и пообещал в будущем:
- Предоставлять более четкую информацию о источниках финансирования
- Обеспечивать прозрачность в отношении доступа к данным
- Сделать прозрачность обязательным условием подобных партнерств.

Почему это важно?

1. Конфликт интересов. OpenAI получила привилегированный доступ к тестовому набору, который должен был независимо оценивать возможности ИИ-моделей, включая их собственные.

2. Эксклюзивность доступа. Другие ИИ-компании не могут получить доступ к FrontierMath из-за контрактных обязательств Epoch перед OpenAI.

3. Достоверность результатов. Недавно заявленные результаты GPT-4 Turbo (25% производительность на FrontierMath) теперь вызывают вопросы, учитывая доступ компании к тестовым данным.

Существует несколько сценариев того, как OpenAI могла использовать полученные данные:
- Прямое включение тестовых данных в тренировочный набор
- Создание похожих тренировочных примеров
- Использование материалов для улучшения архитектуры модели

Эксперты индустрии считают, что доступ к подобным бенчмаркам должен быть либо закрыт для всех ИИ-компаний, либо равномерно открыт. Высказываются опасения, что подобная практика может привести к искусственному завышению результатов тестирования и отсутствию реальной оценки возможностей моделей.

Этот случай поднимает важные вопросы о необходимости большей прозрачности в ИИ, особенно когда речь идет об инструментах оценки и тестирования. Он также демонстрирует растущую потребность в действительно независимых бенчмарках, свободных от влияния крупных ИИ-компаний.



tgoop.com/blockchainRF/11141
Create:
Last Update:

❗️OpenAI и FrontierMath: Большой скандал о прозрачности в ИИ, на который нужно обратить внимание

Разгорелся серьезный скандал вокруг одного из ключевых инструментов оценки математических способностей языковых моделей - бенчмарка FrontierMath.

Выяснилось, что OpenAI тайно финансировала его разработку и имела эксклюзивный доступ к данным.

Компания Epoch AI, создатель бенчмарка FrontierMath, признала, что была связана соглашением о неразглашении с OpenAI, которое запрещало раскрывать информацию об их партнерстве до запуска модели GPT-4 Turbo (o3). При этом математики, создававшие задачи для бенчмарка, не знали об участии OpenAI в проекте.

Epoch AI публично признала ошибку в обеспечении прозрачности и пообещал в будущем:
- Предоставлять более четкую информацию о источниках финансирования
- Обеспечивать прозрачность в отношении доступа к данным
- Сделать прозрачность обязательным условием подобных партнерств.

Почему это важно?

1. Конфликт интересов. OpenAI получила привилегированный доступ к тестовому набору, который должен был независимо оценивать возможности ИИ-моделей, включая их собственные.

2. Эксклюзивность доступа. Другие ИИ-компании не могут получить доступ к FrontierMath из-за контрактных обязательств Epoch перед OpenAI.

3. Достоверность результатов. Недавно заявленные результаты GPT-4 Turbo (25% производительность на FrontierMath) теперь вызывают вопросы, учитывая доступ компании к тестовым данным.

Существует несколько сценариев того, как OpenAI могла использовать полученные данные:
- Прямое включение тестовых данных в тренировочный набор
- Создание похожих тренировочных примеров
- Использование материалов для улучшения архитектуры модели

Эксперты индустрии считают, что доступ к подобным бенчмаркам должен быть либо закрыт для всех ИИ-компаний, либо равномерно открыт. Высказываются опасения, что подобная практика может привести к искусственному завышению результатов тестирования и отсутствию реальной оценки возможностей моделей.

Этот случай поднимает важные вопросы о необходимости большей прозрачности в ИИ, особенно когда речь идет об инструментах оценки и тестирования. Он также демонстрирует растущую потребность в действительно независимых бенчмарках, свободных от влияния крупных ИИ-компаний.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
tgoop.com/blockchainRF/11141

View MORE
Open in Telegram


Telegram News

Date: |

The creator of the channel becomes its administrator by default. If you need help managing your channel, you can add more administrators from your subscriber base. You can provide each admin with limited or full rights to manage the channel. For example, you can allow an administrator to publish and edit content while withholding the right to add new subscribers. Write your hashtags in the language of your target audience. Unlimited number of subscribers per channel Hashtags Hashtags are a fast way to find the correct information on social media. To put your content out there, be sure to add hashtags to each post. We have two intelligent tips to give you:
from us


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American