SCITECHQUANTUMAI Telegram 1214
От провала к половине успеха за пять лет: удивительный прогресс языковых моделей

Исследователи из организации METR в Беркли обнаружили тревожную тенденцию: скорость развития искусственного интеллекта в решении сложных задач растет экспоненциально. С 2019 года так называемый «временной горизонт» — показатель, отражающий продолжительность задач, которые ИИ может выполнить с 50% вероятностью успеха — удваивался каждые семь месяцев, а в 2024 году темп ускорился до удвоения каждые три месяца.

В ходе исследования были проанализированы 13 передовых моделей ИИ на почти 170 реальных задачах в области программирования, кибербезопасности и логического мышления. Результаты поразительны: если в 2019 году GPT-2 не мог решить задачи длительностью более минуты, то выпущенный в феврале 2024 года Claude 3.7 Sonnet уже справляется с половиной задач, требующих от человека 59 минут работы. При сохранении текущих темпов к 2029 году ИИ сможет решать задачи, занимающие у человека целый месяц — время, достаточное для запуска стартапа или научного открытия.

Прогресс моделей ИИ объясняется не только увеличением объемов обучающих данных и количества параметров, но и качественными улучшениями в логическом мышлении, умении использовать инструменты и исправлять ошибки. Однако экономический эффект от этого развития пока ограничен, поскольку текущий «временной горизонт» около 40 минут недостаточен для выполнения по-настоящему ценных задач. Эксперты разделились во мнениях: одни считают прогнозы слишком оптимистичными, другие уверены, что потенциал ИИ используется недостаточно активно из-за отсутствия инвестиций в его интеграцию.

@SciTechQuantumAI
👍6👏2👀21🔥1



tgoop.com/SciTechQuantumAI/1214
Create:
Last Update:

От провала к половине успеха за пять лет: удивительный прогресс языковых моделей

Исследователи из организации METR в Беркли обнаружили тревожную тенденцию: скорость развития искусственного интеллекта в решении сложных задач растет экспоненциально. С 2019 года так называемый «временной горизонт» — показатель, отражающий продолжительность задач, которые ИИ может выполнить с 50% вероятностью успеха — удваивался каждые семь месяцев, а в 2024 году темп ускорился до удвоения каждые три месяца.

В ходе исследования были проанализированы 13 передовых моделей ИИ на почти 170 реальных задачах в области программирования, кибербезопасности и логического мышления. Результаты поразительны: если в 2019 году GPT-2 не мог решить задачи длительностью более минуты, то выпущенный в феврале 2024 года Claude 3.7 Sonnet уже справляется с половиной задач, требующих от человека 59 минут работы. При сохранении текущих темпов к 2029 году ИИ сможет решать задачи, занимающие у человека целый месяц — время, достаточное для запуска стартапа или научного открытия.

Прогресс моделей ИИ объясняется не только увеличением объемов обучающих данных и количества параметров, но и качественными улучшениями в логическом мышлении, умении использовать инструменты и исправлять ошибки. Однако экономический эффект от этого развития пока ограничен, поскольку текущий «временной горизонт» около 40 минут недостаточен для выполнения по-настоящему ценных задач. Эксперты разделились во мнениях: одни считают прогнозы слишком оптимистичными, другие уверены, что потенциал ИИ используется недостаточно активно из-за отсутствия инвестиций в его интеграцию.

@SciTechQuantumAI

BY Изобретая будущее




Share with your friend now:
tgoop.com/SciTechQuantumAI/1214

View MORE
Open in Telegram


Telegram News

Date: |

Telegram users themselves will be able to flag and report potentially false content. In the next window, choose the type of your channel. If you want your channel to be public, you need to develop a link for it. In the screenshot below, it’s ”/catmarketing.” If your selected link is unavailable, you’ll need to suggest another option. End-to-end encryption is an important feature in messaging, as it's the first step in protecting users from surveillance. Among the requests, the Brazilian electoral Court wanted to know if they could obtain data on the origins of malicious content posted on the platform. According to the TSE, this would enable the authorities to track false content and identify the user responsible for publishing it in the first place. Your posting frequency depends on the topic of your channel. If you have a news channel, it’s OK to publish new content every day (or even every hour). For other industries, stick with 2-3 large posts a week.
from us


Telegram Изобретая будущее
FROM American