Perplexity создаёт суперпоиск: единый ИИ для ваших документов, приложений и интернета
Perplexity, один из самых быстрорастущих ИИ-сервисов 2024 года, объявил о приобретении стартапа Carbon.
Эта покупка открывает новую главу в развитии ИИ для персонального и корпоративного использования.
В начале 2025 года Perplexity представит большое обновление — интеграцию с популярными сервисами и приложениями: Notion, Google Docs, Slack и других источниках. Это приведет к тому, что:
Больше не нужно переключаться между десятками вкладок и приложений.
ИИ сам проанализирует все доступные источники и предоставит готовый ответ.
Поиск станет персонализированным благодаря доступу к вашим данным.
Perplexity, один из самых быстрорастущих ИИ-сервисов 2024 года, объявил о приобретении стартапа Carbon.
Эта покупка открывает новую главу в развитии ИИ для персонального и корпоративного использования.
В начале 2025 года Perplexity представит большое обновление — интеграцию с популярными сервисами и приложениями: Notion, Google Docs, Slack и других источниках. Это приведет к тому, что:
Больше не нужно переключаться между десятками вкладок и приложений.
ИИ сам проанализирует все доступные источники и предоставит готовый ответ.
Поиск станет персонализированным благодаря доступу к вашим данным.
❗️Google выпускает модель, которая обучена "думать вслух"
Gemini 2.0 Flash Thinking - это экспериментальная модель, которая обучена "думать вслух" (то есть показывать ход своих рассуждений), что должно привести к более качественным результатам в задачах, требующих логического мышления.
Gemini 2.0 Flash Thinking - это экспериментальная модель, которая обучена "думать вслух" (то есть показывать ход своих рассуждений), что должно привести к более качественным результатам в задачах, требующих логического мышления.
МТС проводит реорганизацию и сокращает инвестиции из-за высокой ключевой ставки
Фокус на снижении долговой нагрузки в 2025 году, отказ от затратных M&A.
Компания объявила, что трансформируется в холдинговую структуру, где ПАО "МТС" сконцентрируется на телеком бизнесе, а
нетелеком-бизнесы выделяются в отдельные юрлица под управлением новой компании "Экосистема МТС".
Все IT-бизнесы (МТС Digital, МТС AI, МТС Big Data, CloudMTS) теперь объединены в MTS Web Services (MWS).
Оптимизация персонала затронет менее 2% сотрудников.
Фокус на снижении долговой нагрузки в 2025 году, отказ от затратных M&A.
Компания объявила, что трансформируется в холдинговую структуру, где ПАО "МТС" сконцентрируется на телеком бизнесе, а
нетелеком-бизнесы выделяются в отдельные юрлица под управлением новой компании "Экосистема МТС".
Все IT-бизнесы (МТС Digital, МТС AI, МТС Big Data, CloudMTS) теперь объединены в MTS Web Services (MWS).
Оптимизация персонала затронет менее 2% сотрудников.
Интерфакс
МТС реформирует корпоративную структуру
ПАО станет холдингом, бизнес-вертикали экосистемы объединятся под новым юрлицом
Бизнес и чиновники жалуются президенту на политику ЦБ
По данным Bloomberg, даже премьер-министр Михаил Мишустин сказал главе государства, что действия Центробанка мешают усилиям правительства по поддержке экономики.
Ключевая ставка сейчас находится на рекордно высоком уровне – 21%. Набиуллина неоднократно заявляла, что этот уровень сейчас необходим, чтобы побороть растущую инфляцию и вернуть ее к цели в 4%.
Путин накануне на прямой линии назвал инфляцию проблемой и заявил о работе правительства и ЦБ над «приземлением» ее темпов.
Сегодня, 20 декабря, совет директоров ЦБ примет решение по ключевой ставке. Она может быть снова повышена, не исключала Набиуллина.
По данным Bloomberg, даже премьер-министр Михаил Мишустин сказал главе государства, что действия Центробанка мешают усилиям правительства по поддержке экономики.
Ключевая ставка сейчас находится на рекордно высоком уровне – 21%. Набиуллина неоднократно заявляла, что этот уровень сейчас необходим, чтобы побороть растущую инфляцию и вернуть ее к цели в 4%.
Путин накануне на прямой линии назвал инфляцию проблемой и заявил о работе правительства и ЦБ над «приземлением» ее темпов.
Сегодня, 20 декабря, совет директоров ЦБ примет решение по ключевой ставке. Она может быть снова повышена, не исключала Набиуллина.
Bloomberg.com
Putin’s Central Banker Angers Russian Elite With Rate Hikes
Long feted as the savior of Russia’s economy in the face of sanctions over the war in Ukraine, central bank Governor Elvira Nabiullina is increasingly under attack from officials who say she’s now destroying it with record high interest rates.
Большие новости из OpenAI: уходит 1-й автор статей GPT, а также выходит модель o3
Алек Рэдфорд был одним из ключевых исследователей OpenAI, сообщил, что планирует заниматься независимыми исследованиями, но продолжит сотрудничать как с OpenAI, так и с другими ИИ-компаниями.
Он был ведущим автором основополагающей исследовательской работы по GPT, участвовал в разработке Whisper, Dall-E.
Рэдфорд присоединился к OpenAI в 2016г.
После вчерашнего выхода ИИ-модели Google, OpenAI хочет выпустить свою модель o3
OpenAI готовит следующее поколение своей модели рассуждений, которая тратит больше времени на "обдумывание" вопросов перед тем как выдать ответ. Но из-за потенциального конфликта с авторскими правами на бренд O2, британским провайдером телекоммуникационных услуг, OpenAI рассматривает возможность назвать следующее обновление "o3", пропустив "o2".
OpenAI планировала использовать новую предварительно обученную модель, Orion, для разработки того, что теперь называют o3.
Вчера Google DeepMind выпустили свою модель
Gemini 2.0 Flash Thinking, которая обучена "думать вслух" (то есть показывать ход своих рассуждений).
Эту работу сделала команда Ноама Шазира , которую Google недавно вернула себе, выкупив за $2,7 млрд.
В отличие от o1 от OpenAI, Gemini 2.0 flash thinking показывает пользователям процесс рассуждения.
Почему это важно:
1. видеть сам процесс размышления модели интересно и полезно. Можно наблюдать, как модель:
- Рассматривает разные возможности
- Генерирует идеи
- Спорит сама с собой
2. Почему обычно не показывают процесс рассуждений:
Существует опасение, что кто-то может собрать эти "следы рассуждений" и использовать их для обучения других моделей, чтобы те могли имитировать способность к рассуждению. То есть это своего рода коммерческий риск.
Теперь получается, что OpenAI хочет показать, что у нее есть нечто превосходящее, посмотрим.
Алек Рэдфорд был одним из ключевых исследователей OpenAI, сообщил, что планирует заниматься независимыми исследованиями, но продолжит сотрудничать как с OpenAI, так и с другими ИИ-компаниями.
Он был ведущим автором основополагающей исследовательской работы по GPT, участвовал в разработке Whisper, Dall-E.
Рэдфорд присоединился к OpenAI в 2016г.
После вчерашнего выхода ИИ-модели Google, OpenAI хочет выпустить свою модель o3
OpenAI готовит следующее поколение своей модели рассуждений, которая тратит больше времени на "обдумывание" вопросов перед тем как выдать ответ. Но из-за потенциального конфликта с авторскими правами на бренд O2, британским провайдером телекоммуникационных услуг, OpenAI рассматривает возможность назвать следующее обновление "o3", пропустив "o2".
OpenAI планировала использовать новую предварительно обученную модель, Orion, для разработки того, что теперь называют o3.
Вчера Google DeepMind выпустили свою модель
Gemini 2.0 Flash Thinking, которая обучена "думать вслух" (то есть показывать ход своих рассуждений).
Эту работу сделала команда Ноама Шазира , которую Google недавно вернула себе, выкупив за $2,7 млрд.
В отличие от o1 от OpenAI, Gemini 2.0 flash thinking показывает пользователям процесс рассуждения.
Почему это важно:
1. видеть сам процесс размышления модели интересно и полезно. Можно наблюдать, как модель:
- Рассматривает разные возможности
- Генерирует идеи
- Спорит сама с собой
2. Почему обычно не показывают процесс рассуждений:
Существует опасение, что кто-то может собрать эти "следы рассуждений" и использовать их для обучения других моделей, чтобы те могли имитировать способность к рассуждению. То есть это своего рода коммерческий риск.
Теперь получается, что OpenAI хочет показать, что у нее есть нечто превосходящее, посмотрим.
The Information
Senior OpenAI Researcher Radford Departs
Alec Radford, an OpenAI researcher who helped develop some of its most important artificial intelligence, on Thursday told colleagues he was leaving to pursue research independently. Radford said he planned to collaborate with OpenAI as well as other AI…
Это нужно вам прочитать. TikTok открыл исходный код своей системы рекомендаций (Monolith), они используют Keras
Это означает, что почти все основные рекомендательные системы в отрасли построены на Keras: YouTube, TikTok, Spotify, Snap, X/Twitter и многие другие.
TikTok доказал, что для создания привлекательного и "затягивающего" продукта не обязательно опираться на социальный граф (то есть сеть друзей и подписчиков, как это делают Facebook или Instagram(запрещенные в РФ).
Вместо этого TikTok создал систему рекомендаций, которая работает в реальном времени и мгновенно адаптируется под пользователя прямо во время просмотра контента. Система анализирует поведение пользователя при прокрутке ленты и сразу же корректирует рекомендации.
Это означает, что почти все основные рекомендательные системы в отрасли построены на Keras: YouTube, TikTok, Spotify, Snap, X/Twitter и многие другие.
TikTok доказал, что для создания привлекательного и "затягивающего" продукта не обязательно опираться на социальный граф (то есть сеть друзей и подписчиков, как это делают Facebook или Instagram(запрещенные в РФ).
Вместо этого TikTok создал систему рекомендаций, которая работает в реальном времени и мгновенно адаптируется под пользователя прямо во время просмотра контента. Система анализирует поведение пользователя при прокрутке ленты и сразу же корректирует рекомендации.
Anthropic: для создания ИИ-агентов эффективных не нужны сложные фреймворки, нужны API.
2025 год станет годом агентных систем, но побеждать будут простые и элегантные решения на API.
Почему API лучше?
• Полный контроль над процессами
• Прозрачность работы системы
• Простота отладки
• Точная настройка под задачи
• Минимум лишнего кода
Подробнее тут.
2025 год станет годом агентных систем, но побеждать будут простые и элегантные решения на API.
Почему API лучше?
• Полный контроль над процессами
• Прозрачность работы системы
• Простота отладки
• Точная настройка под задачи
• Минимум лишнего кода
Подробнее тут.
Telegram
All about AI, Web 3.0, BCI
2025: The Year of LLM-Based Agentic Systems. Anthropic has shared critical insights about LLM agents development.
Here's what you need to know:
1. Key Components Are Ready:
• Computer use capabilities
• Model Context Protocol (MCP)
• Enhanced…
Here's what you need to know:
1. Key Components Are Ready:
• Computer use capabilities
• Model Context Protocol (MCP)
• Enhanced…
⚡️OpenAI выпустили модель o3
Она пока в тестовом режиме
Больше графиков тут.
Ключевые достижения:
• Рейтинг 2700+ на CodeForces (выше многих топовых программистов)
• 96.7% точность на олимпиаде по математике AIME 2024
• 87.7% на научных вопросах уровня PhD (GPQA Diamond)
• 71.7% на SWE-bench (инженерия ПО)
• 25.2% на сверхсложном EpochAI Frontier Math (рост с 2%)
Прорыв в рассуждениях:
• 87.5% на закрытом тесте ARC-AGI
• В 3 раза превосходит предшественника o1
• Подтверждённая работа с полностью новыми задачами
Технологические особенности:
• Построена на масштабировании обучения с подкреплением (RL)
• Самая дорогая модель в истории на этапе тестирования
• Представлена компактная версия o3-mini
Значение для индустрии:
• Открывает новую эру в масштабировании ИИ
• Показывает эффективность увеличения вычислительной мощности
• Ожидается снижение стоимости использования
Она пока в тестовом режиме
Больше графиков тут.
Ключевые достижения:
• Рейтинг 2700+ на CodeForces (выше многих топовых программистов)
• 96.7% точность на олимпиаде по математике AIME 2024
• 87.7% на научных вопросах уровня PhD (GPQA Diamond)
• 71.7% на SWE-bench (инженерия ПО)
• 25.2% на сверхсложном EpochAI Frontier Math (рост с 2%)
Прорыв в рассуждениях:
• 87.5% на закрытом тесте ARC-AGI
• В 3 раза превосходит предшественника o1
• Подтверждённая работа с полностью новыми задачами
Технологические особенности:
• Построена на масштабировании обучения с подкреплением (RL)
• Самая дорогая модель в истории на этапе тестирования
• Представлена компактная версия o3-mini
Значение для индустрии:
• Открывает новую эру в масштабировании ИИ
• Показывает эффективность увеличения вычислительной мощности
• Ожидается снижение стоимости использования
Итоги уходящей недели в России и мире, что имеет значение
Прорыв недели: EPFl, Google раскрыли как мозг управляет движениями всего тела.
Текст недели - видение Ильи Суцкевера о будущем ИИ
1. OpenAI анонсировали o3 - ИИ-модель рассуждений следующего поколения. Это прорыв в адаптации ИИ к новым задачам
2. Отставание в 3,5 раза: доля ИТ в российском ВВП втрое меньше, чем в ЕС, отчет Атона.
3. Глава правительства РФ поддержал криптовалюты, пока рынок получает миллиардные инвестиции.
4. Газпромбанк наградил своей премией лучших ученых, все подробности тут.
5. Маск: к 2030г. 1млн человек будут ходить с имплантом Neuralink со скоростью передачи данных через 1 млн бит/сек.
6. Google выпустили свою ИИ- модель, которая обучена "думать вслух".
7. МТС проводит реорганизацию и сокращает инвестиции из-за высокой ключевой ставки.
8. Китайский стартап по роботам запустил массовое производство в октябре и планирует выпустить 900 роботов к концу года.
9. Еще о будущем ИИ от ведущих исследователей мира, которые были на NeurIPS. Все подробности здесь.
10. Крупнейшая инвесткомпания мира BlackRock выпустила отчет о том, как включать биткоин в инвестиционный портфель. Также они выпустили прогноз по 2025: ИИ, стареющее население, фрагментация рынка. При этом у инвесткомпании есть желание иметь полный контроль над биткоином. Разбор ситуации здесь.
11. Легендарный Джефф Дин, Google, представил новый взгляд на будущее разработки микросхем с применением ИИ.
12. Маск на приватной встрече с главой TSMC заявил, что будущее за роботами, не электроавтомобили.
13. 2025 станет годом крипто-IPO - отчет Bitwise Investments.
14. Самый большой венчурный раунд в истории собрала платформа анализа данных Databricks - $10млрд.
15. Космическая индустрия в 2024 году показала взрывной рост. Анализ рынка.
16. Google DeepMind создала ИИ-агента, способного эффективно планировать действия в сложных ситуациях.
17. Stripe и Remote запустили оплату труда фрилансеров в криптовалюте.
18. Noetik создала ИИ, моделирующий поведение клеток в тканях человека.
19. Топы из SpaceX, Scale AI вошли в DOGE Маска и планируют с ИИ радикальную оптимизацию госуправления.
20. Свежий отчет о трендах в 2025 от Deloitte.
21. Perplexity создаёт суперпоиск, подробнее тут.
22. TikTok открыл исходный код своей системы рекомендаций Monolith.
23. Anthropic: для создания ИИ-агентов эффективных не нужны сложные фреймворки, нужны API.
24. Meta Motivo — 1-я ИИ-модель, которая учится управлять виртуальными персонажами так, чтобы их движения выглядели естественно и были похожи на человеческие.
25. Новый генератор видео с ИИ от Odissey.
26. Anthropic выявили тревожное явление стратегического обмана в процессе обучения больших языковых моделей. Подробности тут.
27. Google DeepMind выходят на рынок роботов гуманоидов в партнерстве с Apptronik.
Прорыв недели: EPFl, Google раскрыли как мозг управляет движениями всего тела.
Текст недели - видение Ильи Суцкевера о будущем ИИ
1. OpenAI анонсировали o3 - ИИ-модель рассуждений следующего поколения. Это прорыв в адаптации ИИ к новым задачам
2. Отставание в 3,5 раза: доля ИТ в российском ВВП втрое меньше, чем в ЕС, отчет Атона.
3. Глава правительства РФ поддержал криптовалюты, пока рынок получает миллиардные инвестиции.
4. Газпромбанк наградил своей премией лучших ученых, все подробности тут.
5. Маск: к 2030г. 1млн человек будут ходить с имплантом Neuralink со скоростью передачи данных через 1 млн бит/сек.
6. Google выпустили свою ИИ- модель, которая обучена "думать вслух".
7. МТС проводит реорганизацию и сокращает инвестиции из-за высокой ключевой ставки.
8. Китайский стартап по роботам запустил массовое производство в октябре и планирует выпустить 900 роботов к концу года.
9. Еще о будущем ИИ от ведущих исследователей мира, которые были на NeurIPS. Все подробности здесь.
10. Крупнейшая инвесткомпания мира BlackRock выпустила отчет о том, как включать биткоин в инвестиционный портфель. Также они выпустили прогноз по 2025: ИИ, стареющее население, фрагментация рынка. При этом у инвесткомпании есть желание иметь полный контроль над биткоином. Разбор ситуации здесь.
11. Легендарный Джефф Дин, Google, представил новый взгляд на будущее разработки микросхем с применением ИИ.
12. Маск на приватной встрече с главой TSMC заявил, что будущее за роботами, не электроавтомобили.
13. 2025 станет годом крипто-IPO - отчет Bitwise Investments.
14. Самый большой венчурный раунд в истории собрала платформа анализа данных Databricks - $10млрд.
15. Космическая индустрия в 2024 году показала взрывной рост. Анализ рынка.
16. Google DeepMind создала ИИ-агента, способного эффективно планировать действия в сложных ситуациях.
17. Stripe и Remote запустили оплату труда фрилансеров в криптовалюте.
18. Noetik создала ИИ, моделирующий поведение клеток в тканях человека.
19. Топы из SpaceX, Scale AI вошли в DOGE Маска и планируют с ИИ радикальную оптимизацию госуправления.
20. Свежий отчет о трендах в 2025 от Deloitte.
21. Perplexity создаёт суперпоиск, подробнее тут.
22. TikTok открыл исходный код своей системы рекомендаций Monolith.
23. Anthropic: для создания ИИ-агентов эффективных не нужны сложные фреймворки, нужны API.
24. Meta Motivo — 1-я ИИ-модель, которая учится управлять виртуальными персонажами так, чтобы их движения выглядели естественно и были похожи на человеческие.
25. Новый генератор видео с ИИ от Odissey.
26. Anthropic выявили тревожное явление стратегического обмана в процессе обучения больших языковых моделей. Подробности тут.
27. Google DeepMind выходят на рынок роботов гуманоидов в партнерстве с Apptronik.
Nebius А.Воложа выпустила 1-е в мире датасеты для обучения ИИ- агентов
Исследователи собирали большой набор данных для обучения ИИ-агентов, которые могут решать задачи программирования.
Набор данных такого рода
позволяет обучать ИИ не просто писать код, а решать реальные проблемы в существующих проектах.
Уже показывает впечатляющие результаты: улучшение базовой модели Qwen2.5-72B на 30%.
1. nebius/SWE-bench-extra
• 6,411 пар "Issue-Pull Request" из реальных Python-проектов
• Каждая пара включает описание проблемы и верифицированное решение
2. nebius/SWE-agent-trajectories
• 80,036 траекторий решения задач ИИ-агентом
• Показывает полный путь от анализа проблемы до успешного решения
Модель, обученная на этих данных, достигла точности 40.6% на бенчмарке SWE-bench — это лучший показатель среди открытых моделей.
Исследователи собирали большой набор данных для обучения ИИ-агентов, которые могут решать задачи программирования.
Набор данных такого рода
позволяет обучать ИИ не просто писать код, а решать реальные проблемы в существующих проектах.
Уже показывает впечатляющие результаты: улучшение базовой модели Qwen2.5-72B на 30%.
1. nebius/SWE-bench-extra
• 6,411 пар "Issue-Pull Request" из реальных Python-проектов
• Каждая пара включает описание проблемы и верифицированное решение
2. nebius/SWE-agent-trajectories
• 80,036 траекторий решения задач ИИ-агентом
• Показывает полный путь от анализа проблемы до успешного решения
Модель, обученная на этих данных, достигла точности 40.6% на бенчмарке SWE-bench — это лучший показатель среди открытых моделей.
Nebius
Scaling data collection for training software engineering agents
In this follow-up to our previous research blog post, we focus on the data collection process used to train our action generator and critic models. We’re also releasing two datasets on Hugging Face: nebius/SWE-bench-extra, containing 6,440 Issue-Pull Request…
ИИ, наукой и криптой у Трампа займутся экс-сотрудники Маска и Тиля
Трамп сделал несколько важных заявлений о своей технологической команде:
1. Майкл Крациос назначен директором Управления научно-технической политики Белого дома (OSTP) и помощником президента по науке и технологиям.
До этого он работал главным технологическим директором США в администрации Трампа (2017-2021), также работал в Thiel Capital.
2. Доктор Линн Паркер становится исполнительным директором Президентского совета консультантов по науке и технологиям (PCAST).
Она профессор в Университете Теннесси, робототехник.
3. Бо Хайнс возглавит новый Президентский совет консультантов по цифровым активам (известный как "Крипто совет") в качестве исполнительного директора.
Ему 29 лет, выпускник Йеля, футболист.
4. Шрирам Кришнан назначен старшим советником по политике в области ИИ в OSTP.
Работал в Х, Meta (запрещенная в России), a16Z и Microsoft.
Трамп сделал несколько важных заявлений о своей технологической команде:
1. Майкл Крациос назначен директором Управления научно-технической политики Белого дома (OSTP) и помощником президента по науке и технологиям.
До этого он работал главным технологическим директором США в администрации Трампа (2017-2021), также работал в Thiel Capital.
2. Доктор Линн Паркер становится исполнительным директором Президентского совета консультантов по науке и технологиям (PCAST).
Она профессор в Университете Теннесси, робототехник.
3. Бо Хайнс возглавит новый Президентский совет консультантов по цифровым активам (известный как "Крипто совет") в качестве исполнительного директора.
Ему 29 лет, выпускник Йеля, футболист.
4. Шрирам Кришнан назначен старшим советником по политике в области ИИ в OSTP.
Работал в Х, Meta (запрещенная в России), a16Z и Microsoft.
Telegram
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
⚡️Команда Трампа создает президентский совет по крипте
А также планируется создание специальной должности главного по крипте, который возглавит этот совет.
Трамп анонсировал создание этого совета во время выступления на биткоин-конференции в Нэшвилле в…
А также планируется создание специальной должности главного по крипте, который возглавит этот совет.
Трамп анонсировал создание этого совета во время выступления на биткоин-конференции в Нэшвилле в…
Модель o3 от OpenAI еще не AGI, но это серьезный шаг вперед - Франсуа Шолле, создатель фреймворка Keras и основатель ARC Prize Foundation
По мнению Шолле, o3 - качественный скачок в развитии ИИ. Главное достижение - преодоление фундаментального ограничения языковых моделей: неспособности комбинировать знания в новых ситуациях.
OpenAI достигла беспрецедентных результатов на бенчмарке ARC-AGI:
- 75.7% на полу-приватном наборе тестов при ограниченных вычислениях
- 87.5% при использовании в 172 раза больших вычислительных мощностей
- До этого прогресс был крайне медленным: с 0% (GPT-3, 2020) до 5% (GPT-4o, 2024).
Несмотря на впечатляющие результаты, система имеет важные ограничения:
- Это всё еще не AGI
- Высокая стоимость использования: $17-20 за задачу (человек решает за $5)
- Зависимость от размеченных человеком данных
- Неспособность к автономному обучению
Что дальше?
Шолле обозначает несколько ключевых направлений развития:
1. Воспроизведение o3 в открытом коде через соревнование ARC Prize 2025
2. Запуск нового, более сложного бенчмарка ARC-AGI-2
3. Разработка тестов третьего поколения с принципиально новым форматом
Шолле предлагает интересный критерий достижения AGI: момент, когда станет невозможно создавать задачи, которые легки для обычных людей, но сложны для ИИ.
Ожидается, что стоимость использования подобных систем будет значительно снижаться в ближайшие месяцы и годы, делая их экономически конкурентоспособными с человеческим трудом.
O3 демонстрирует, что прогресс в ИИ теперь зависит не от простого увеличения размера моделей, а от принципиально новых идей и подходов.
По мнению Шолле, o3 - качественный скачок в развитии ИИ. Главное достижение - преодоление фундаментального ограничения языковых моделей: неспособности комбинировать знания в новых ситуациях.
OpenAI достигла беспрецедентных результатов на бенчмарке ARC-AGI:
- 75.7% на полу-приватном наборе тестов при ограниченных вычислениях
- 87.5% при использовании в 172 раза больших вычислительных мощностей
- До этого прогресс был крайне медленным: с 0% (GPT-3, 2020) до 5% (GPT-4o, 2024).
Несмотря на впечатляющие результаты, система имеет важные ограничения:
- Это всё еще не AGI
- Высокая стоимость использования: $17-20 за задачу (человек решает за $5)
- Зависимость от размеченных человеком данных
- Неспособность к автономному обучению
Что дальше?
Шолле обозначает несколько ключевых направлений развития:
1. Воспроизведение o3 в открытом коде через соревнование ARC Prize 2025
2. Запуск нового, более сложного бенчмарка ARC-AGI-2
3. Разработка тестов третьего поколения с принципиально новым форматом
Шолле предлагает интересный критерий достижения AGI: момент, когда станет невозможно создавать задачи, которые легки для обычных людей, но сложны для ИИ.
Ожидается, что стоимость использования подобных систем будет значительно снижаться в ближайшие месяцы и годы, делая их экономически конкурентоспособными с человеческим трудом.
O3 демонстрирует, что прогресс в ИИ теперь зависит не от простого увеличения размера моделей, а от принципиально новых идей и подходов.
ARC Prize
OpenAI o3 Breakthrough High Score on ARC-AGI-Pub
OpenAI o3 scores 75.7% on ARC-AGI public leaderboard.
Карта рынка голосовых ИИ: итоги 2024 и прогнозы на 2025, отчет Cartesia
В 2024 появились полноценные разговорные системы, объединяющие распознавание речи, языковые модели и синтез речи в единое целое. OpenAI представила голосовой режим в ChatGPT, а такие компании как Kyutai создали системы, способные слушать пользователя во время собственной речи — важный шаг к естественному диалогу.
Стоимость использования языковых моделей упала в разы: с $45 до $2.75 за миллион токенов. При этом качество распознавания и синтеза речи значительно выросло.
Интерес к голосовым технологиям стремительно растет — количество стартапов в этой области в Y Combinator увеличилось на 70% между зимним и осенним наборами 2024 года. Голосовые ИИ-помощники активно внедряются в:
- Здравоохранение: запись к врачу, напоминания о приеме лекарств
- Страхование: обработка претензий и продление полисов
- Логистику: отслеживание грузов и планирование
- Гостиничный бизнес: бронирование и обслуживание
- Малый бизнес: автоматизация телефонных звонков
Что ждет нас в 2025 году?
1. Ожидается появление более совершенных систем преобразования речи в речь с задержкой всего 160 мс (для сравнения: у человека — 230 мс). Они будут лучше понимать контекст, эмоции и справляться с перебиваниями в разговоре.
2. Развитие компактных моделей позволит использовать голосовых ассистентов без интернета — на телефонах, в автомобилях и различных устройствах. Это обеспечит мгновенный отклик и полную приватность данных.
3. Голосовые ассистенты начнут справляться с комплексными задачами. Например, при обращении в авиакомпанию ИИ сможет самостоятельно проверить бронирование, найти альтернативные рейсы и внести изменения в билет — все в рамках одного естественного разговора.
2025 год обещает стать годом массового внедрения голосовых технологий.
В 2024 появились полноценные разговорные системы, объединяющие распознавание речи, языковые модели и синтез речи в единое целое. OpenAI представила голосовой режим в ChatGPT, а такие компании как Kyutai создали системы, способные слушать пользователя во время собственной речи — важный шаг к естественному диалогу.
Стоимость использования языковых моделей упала в разы: с $45 до $2.75 за миллион токенов. При этом качество распознавания и синтеза речи значительно выросло.
Интерес к голосовым технологиям стремительно растет — количество стартапов в этой области в Y Combinator увеличилось на 70% между зимним и осенним наборами 2024 года. Голосовые ИИ-помощники активно внедряются в:
- Здравоохранение: запись к врачу, напоминания о приеме лекарств
- Страхование: обработка претензий и продление полисов
- Логистику: отслеживание грузов и планирование
- Гостиничный бизнес: бронирование и обслуживание
- Малый бизнес: автоматизация телефонных звонков
Что ждет нас в 2025 году?
1. Ожидается появление более совершенных систем преобразования речи в речь с задержкой всего 160 мс (для сравнения: у человека — 230 мс). Они будут лучше понимать контекст, эмоции и справляться с перебиваниями в разговоре.
2. Развитие компактных моделей позволит использовать голосовых ассистентов без интернета — на телефонах, в автомобилях и различных устройствах. Это обеспечит мгновенный отклик и полную приватность данных.
3. Голосовые ассистенты начнут справляться с комплексными задачами. Например, при обращении в авиакомпанию ИИ сможет самостоятельно проверить бронирование, найти альтернативные рейсы и внести изменения в билет — все в рамках одного естественного разговора.
2025 год обещает стать годом массового внедрения голосовых технологий.
❗️Матрица для роботов - Genesis учит ИИ через миллиарды реальностей
Genesis - новая платформа физической симуляции, переворачивает наше представление об обучении ИИ.
Ключевая идея проста, если ИИ может успешно управлять тысячей роботов в миллиарде различных симуляций, то наш реальный мир становится просто еще одним сценарием в этом огромном пространстве возможностей.
- Скорость обучения в 430,000 раз выше реального времени
- За 1 час на GPU робот получает опыт, равный 10 годам реальной практики(!)
- Параллельный запуск 100,000 копий симуляции на одном GPU
Как и в фильме "Матрица", где Нео освоил боевые искусства за считанные секунды в виртуальном додзё, Genesis создает условия, где роботы могут приобретать сложные навыки через интенсивное обучение в виртуальной среде.
Подробнее тут
Genesis - новая платформа физической симуляции, переворачивает наше представление об обучении ИИ.
Ключевая идея проста, если ИИ может успешно управлять тысячей роботов в миллиарде различных симуляций, то наш реальный мир становится просто еще одним сценарием в этом огромном пространстве возможностей.
- Скорость обучения в 430,000 раз выше реального времени
- За 1 час на GPU робот получает опыт, равный 10 годам реальной практики(!)
- Параллельный запуск 100,000 копий симуляции на одном GPU
Как и в фильме "Матрица", где Нео освоил боевые искусства за считанные секунды в виртуальном додзё, Genesis создает условия, где роботы могут приобретать сложные навыки через интенсивное обучение в виртуальной среде.
Подробнее тут
Telegram
All about AI, Web 3.0, BCI
A team of researchers unveiled Genesis, an open-source physics engine that combines generative AI with simulations
Generative physics engine able to generate 4D dynamical worlds powered by a physics simulation platform designed for general-purpose robotics…
Generative physics engine able to generate 4D dynamical worlds powered by a physics simulation platform designed for general-purpose robotics…