Андрей Карпатый, Nvidia и Meta о будущем ИИ-агентов.
Недавно вышли 2 интересные работы об агентных системах ИИ, которые дают разные перспективы на их развитие.
Первая работа от NVIDIA и Georgia Tech утверждает, что будущее агентного ИИ за малыми языковыми моделями (SLMs). Основная идея - для большинства повторяющихся специализированных задач огромные модели избыточны. SLMs, которые помещаются на обычный компьютер, могут эффективнее справляться с рутинными операциями, экономя ресурсы и деньги.
Вторая работа от Meta* проверяет, насколько хорошо современные ИИ могут воспроизводить научные результаты. Исследователи создали бенчмарк на основе соревнования по ускорению обучения GPT-2, где сообщество сократило время с 45 до 3 минут.
В результате даже лучшие модели (o3-mini, Claude 3.7, Gemini-2.5-Pro, DeepSeek-R1) восстанавливают менее половины улучшений, даже когда им дают подробные инструкции.
Исследователи выявили несколько ключевых проблем:
- Агенты часто не могут правильно реализовать даже описанные изменения
- Сложности с пониманием и применением новых техник
- Проблемы с отладкой собственного кода
- Трудности с оптимизацией производительности.
Получается , если большие модели не справляются с воспроизведением кода, как могут справиться малые?
Ответ в типах задач. NVIDIA говорит о простых повторяющихся операциях, а Meta тестирует сложное научное программирование с отладкой и оптимизацией. Это разные миры сложности.
Что это значит для нас?
1. Специализация работает, узкие модели для узких задач могут быть эффективнее универсальных
2. Автономность далека, даже с подробными инструкциями ИИ пока не может надёжно программировать
3. Будущее гибридное, вероятно, увидим системы из множества специализированных моделей разного размера.
Эти работы показывают, что путь к полноценным ИИ-агентам будет постепенным. Экономическая оптимизация через SLMs имеет смысл, но не стоит ожидать прорывов в сложных творческих задачах.
Интересный комментарий от Андрея Карпатого, он отмечает, что рекурсивное самоулучшение ИИ — это не внезапный скачок, а процесс, который уже идёт. От IDE до GitHub Copilot — мы постепенно автоматизируем всё больше.
При этом Карпатый напоминает: nanoGPT — это всего 750 строк учебного кода, а реальные системы в сотни раз сложнее.
Так что обе статьи правы - специализация неизбежна, но до автономных ИИ-исследователей ещё далеко.
*запрещенная в России организация.
Недавно вышли 2 интересные работы об агентных системах ИИ, которые дают разные перспективы на их развитие.
Первая работа от NVIDIA и Georgia Tech утверждает, что будущее агентного ИИ за малыми языковыми моделями (SLMs). Основная идея - для большинства повторяющихся специализированных задач огромные модели избыточны. SLMs, которые помещаются на обычный компьютер, могут эффективнее справляться с рутинными операциями, экономя ресурсы и деньги.
Вторая работа от Meta* проверяет, насколько хорошо современные ИИ могут воспроизводить научные результаты. Исследователи создали бенчмарк на основе соревнования по ускорению обучения GPT-2, где сообщество сократило время с 45 до 3 минут.
В результате даже лучшие модели (o3-mini, Claude 3.7, Gemini-2.5-Pro, DeepSeek-R1) восстанавливают менее половины улучшений, даже когда им дают подробные инструкции.
Исследователи выявили несколько ключевых проблем:
- Агенты часто не могут правильно реализовать даже описанные изменения
- Сложности с пониманием и применением новых техник
- Проблемы с отладкой собственного кода
- Трудности с оптимизацией производительности.
Получается , если большие модели не справляются с воспроизведением кода, как могут справиться малые?
Ответ в типах задач. NVIDIA говорит о простых повторяющихся операциях, а Meta тестирует сложное научное программирование с отладкой и оптимизацией. Это разные миры сложности.
Что это значит для нас?
1. Специализация работает, узкие модели для узких задач могут быть эффективнее универсальных
2. Автономность далека, даже с подробными инструкциями ИИ пока не может надёжно программировать
3. Будущее гибридное, вероятно, увидим системы из множества специализированных моделей разного размера.
Эти работы показывают, что путь к полноценным ИИ-агентам будет постепенным. Экономическая оптимизация через SLMs имеет смысл, но не стоит ожидать прорывов в сложных творческих задачах.
Интересный комментарий от Андрея Карпатого, он отмечает, что рекурсивное самоулучшение ИИ — это не внезапный скачок, а процесс, который уже идёт. От IDE до GitHub Copilot — мы постепенно автоматизируем всё больше.
При этом Карпатый напоминает: nanoGPT — это всего 750 строк учебного кода, а реальные системы в сотни раз сложнее.
Так что обе статьи правы - специализация неизбежна, но до автономных ИИ-исследователей ещё далеко.
*запрещенная в России организация.
Йошуа Бенжио:ИИ с рассуждением работает,но вводит в заблуждение, когда мы думаем, что понимаем через него внутренние процессы модели
Новая работа группы исследователей, среди которых лауреат премии Тьюринга, а также представители Google, Oxford и др. выявила серьезную проблему в том, как мы понимаем работу современных ИИ-систем.
Метод CoT заставляет ИИ показывать "пошаговые рассуждения" перед ответом. Это реально улучшает качество решений — ИИ лучше справляется со сложными задачами. Но исследователи обнаружили подвох в том, как мы это интерпретируем.
Ключевая находка - 25% недавних научных работ ошибочно считают CoT методом интерпретации ИИ. В критических областях цифры еще хуже:
- 38% работ по медицинскому ИИ
- 63% работ по беспилотным автомобилям.
Почему это опасно?
1. Скрытые предубеждения ИИ может принимать решения на основе скрытых предвзятостей, но в объяснениях их не упоминать. При этом рационализация выглядит убедительно.
2. Иллюзия прозрачности Модель может давать правильный ответ через внутренние процессы, которые мы не видим, а показанные "рассуждения" остаются ошибочными.
3. Неверное доверие. В медицине или праве ложная уверенность в понимании логики ИИ может иметь серьезные последствия.
Исследователи предполагают, что словесные объяснения CoT не отражают реальные вычислительные процессы в нейросетях. Это как если бы человека попросили объяснить, почему ему нравится определенная музыка — он даст разумное объяснение, но реальные нейронные процессы гораздо сложнее.
Авторы не призывают отказаться от CoT — метод действительно работает для улучшения результатов. Но предлагают:
1. Использовать CoT для повышения качества решений, а не для "понимания" ИИ
2. Не полагаться только на словесные объяснения в критических решениях
3. Разрабатывать отдельные методы проверки надежности рассуждений
4. Усилить человеческий контроль в важных областях.
Новая работа группы исследователей, среди которых лауреат премии Тьюринга, а также представители Google, Oxford и др. выявила серьезную проблему в том, как мы понимаем работу современных ИИ-систем.
Метод CoT заставляет ИИ показывать "пошаговые рассуждения" перед ответом. Это реально улучшает качество решений — ИИ лучше справляется со сложными задачами. Но исследователи обнаружили подвох в том, как мы это интерпретируем.
Ключевая находка - 25% недавних научных работ ошибочно считают CoT методом интерпретации ИИ. В критических областях цифры еще хуже:
- 38% работ по медицинскому ИИ
- 63% работ по беспилотным автомобилям.
Почему это опасно?
1. Скрытые предубеждения ИИ может принимать решения на основе скрытых предвзятостей, но в объяснениях их не упоминать. При этом рационализация выглядит убедительно.
2. Иллюзия прозрачности Модель может давать правильный ответ через внутренние процессы, которые мы не видим, а показанные "рассуждения" остаются ошибочными.
3. Неверное доверие. В медицине или праве ложная уверенность в понимании логики ИИ может иметь серьезные последствия.
Исследователи предполагают, что словесные объяснения CoT не отражают реальные вычислительные процессы в нейросетях. Это как если бы человека попросили объяснить, почему ему нравится определенная музыка — он даст разумное объяснение, но реальные нейронные процессы гораздо сложнее.
Авторы не призывают отказаться от CoT — метод действительно работает для улучшения результатов. Но предлагают:
1. Использовать CoT для повышения качества решений, а не для "понимания" ИИ
2. Не полагаться только на словесные объяснения в критических решениях
3. Разрабатывать отдельные методы проверки надежности рассуждений
4. Усилить человеческий контроль в важных областях.
alphaXiv
Chain-of-Thought Is Not Explainability | alphaXiv
View recent discussion. Abstract: Chains-of-thought (CoT) allow language models to verbalise multi-step rationales before producing their final answer. While this technique often boosts task performance and offers an impression of transparency into the model’s…
Anthropic теряет ключевых сотрудников, а Цукерберг заплатит по $300млн/4года новым 10 сотрудникам, которых он переманил для своей лаборатории по сверхразумному ИИ.
Битва за лучшие таланты продолжается, на этот раз Anthropic, у которой выручка выросла до $4 млрд в год, теряет ключевых сотрудников:
1. Борис Черный, инженер Claude Code
2. Кэт Уу, менеджер продукта Claude Code.
Они оба переходят в стартап Anysphere, который стоит за разработкой Cursor, приложения для кодирования с помощью ИИ. Cursor использует ИИ, в том числе от Anthropic, чтобы помогать разработчикам писать код.
Черный станет главным архитектором и руководителем инженерного отдела, а Уу — главой продуктов в Anysphere. Переход произошел на этой неделе. Anthropic представила Claude Code в феврале как отдельный продукт для кодирования.
Также стало известно, что Марк Цукерберг, пообещал новым сотрудникам лаборатории по созданию суперразума зарплаты до $300 млн за 4 года, из которых более $100 млн предоставляется в первый год работы. В зарплатных пакетах также акции Meta(запрещенная в РФ), которые в первый год полностью переходят во владение сотрудника.
Что ещё интересного? Каждый из 11 сотрудников новой лаборатории Цукерберга — иммигрант, получивший высшее образование за границей:
7 человек получили образование в Китае, 1 в Индии, 1 - Австралии , 1 - UK, 1 - Южной Африке. 8 человек имеют степень доктора наук.
Битва за лучшие таланты продолжается, на этот раз Anthropic, у которой выручка выросла до $4 млрд в год, теряет ключевых сотрудников:
1. Борис Черный, инженер Claude Code
2. Кэт Уу, менеджер продукта Claude Code.
Они оба переходят в стартап Anysphere, который стоит за разработкой Cursor, приложения для кодирования с помощью ИИ. Cursor использует ИИ, в том числе от Anthropic, чтобы помогать разработчикам писать код.
Черный станет главным архитектором и руководителем инженерного отдела, а Уу — главой продуктов в Anysphere. Переход произошел на этой неделе. Anthropic представила Claude Code в феврале как отдельный продукт для кодирования.
Также стало известно, что Марк Цукерберг, пообещал новым сотрудникам лаборатории по созданию суперразума зарплаты до $300 млн за 4 года, из которых более $100 млн предоставляется в первый год работы. В зарплатных пакетах также акции Meta(запрещенная в РФ), которые в первый год полностью переходят во владение сотрудника.
Что ещё интересного? Каждый из 11 сотрудников новой лаборатории Цукерберга — иммигрант, получивший высшее образование за границей:
7 человек получили образование в Китае, 1 в Индии, 1 - Австралии , 1 - UK, 1 - Южной Африке. 8 человек имеют степень доктора наук.
The Information
Anthropic Revenue Hits $4 Billion Annual Pace as Competition With Cursor Intensifies
Anysphere, the maker of Cursor, an artificial intelligence-powered coding app, has hired two leaders of Anthropic’s competing coding product, Claude Code, according to one of the leaders. The move is notable because Cursor relies on AI from Anthropic to power…
Греф не видит никаких перспектив цифрового рубля
«Я не понимаю, зачем мне как физическому лицу нужен такой вариант, как банку – тоже. И предприятиям – зачем это нужно я тоже пока не очень хорошо понимаю», – отметил Греф.
Все, что может дать цифровой рубль, могут сделать и безналичные расчеты, говорит глава Сбера. О том, что происходит с цифровым ₽, читайте здесь.
«Я не понимаю, зачем мне как физическому лицу нужен такой вариант, как банку – тоже. И предприятиям – зачем это нужно я тоже пока не очень хорошо понимаю», – отметил Греф.
Все, что может дать цифровой рубль, могут сделать и безналичные расчеты, говорит глава Сбера. О том, что происходит с цифровым ₽, читайте здесь.
Ведомости
Глава Сбербанка не верит в цифровой рубль
Финансовая система России и так достаточно развита с точки зрения цифровизации
👀ого! Самый крупный инвестфонд BlackRock говорит, что их биткоин-фонд зарабатывает больше денег, чем их крупный фонд S&P 500(IVV), несмотря на то, что у последнего значительно больше активов.
Это значит, что биткоин сейчас очень популярен среди инвесторов, и фонд с ним приносит хорошую прибыль благодаря высоким вложениям и комиссии.
За последние 18 месяцев IBIT привлек около $75 млрд от институциональных и розничных инвесторов, что составляет более 55% всех активов ETF на биткоин.
С текущей долей в 0,25% от активов фонд генерирует около $187,2 млн годового дохода. Это немного превышает $187,1 млн, которые приносит IVV, несмотря на то, что его активы в 9 раз больше ($624 млрд) при комиссии 0,03%.
Рост популярности биткоин-ETF связан с открытием доступа со стороны регулирующих органов США, что привлекает капитал от хедж-фондов, пенсионных фондов и банков, укрепляя доминирование биткоина над меньшими альткоинами.
Это значит, что биткоин сейчас очень популярен среди инвесторов, и фонд с ним приносит хорошую прибыль благодаря высоким вложениям и комиссии.
За последние 18 месяцев IBIT привлек около $75 млрд от институциональных и розничных инвесторов, что составляет более 55% всех активов ETF на биткоин.
С текущей долей в 0,25% от активов фонд генерирует около $187,2 млн годового дохода. Это немного превышает $187,1 млн, которые приносит IVV, несмотря на то, что его активы в 9 раз больше ($624 млрд) при комиссии 0,03%.
Рост популярности биткоин-ETF связан с открытием доступа со стороны регулирующих органов США, что привлекает капитал от хедж-фондов, пенсионных фондов и банков, укрепляя доминирование биткоина над меньшими альткоинами.
Bloomberg.com
BlackRock Bitcoin ETF Drives More Revenue Than Its S&P 500 Fund
At the world’s biggest asset manager, a Bitcoin exchange-traded fund now generates more revenue than its signature tracker of the S&P 500 Index.
Греф: через 3-5 лет в РФ будут массовые банкротства среди компаний, если не внедрят ИИ
Глава Сбера считает, что ИИ не панацея. Большинство отраслей в стране находятся от ИИ на расстоянии миллионов световых лет.
В компаниях нет базовых принципов менеджмента. Поэтому, чтобы там появился ИИ, нужно решить базовые проблемы менеджмента и оцифровать процессы. И только после этого начать внедрять ИИ.
Сегодня в России на повестке дня должна стоять задача по созданию условий, чтобы компании массово подключались/трансформировались с ИИ.
В среднесрочной перспективе в течение 3-5 лет будут массовые банкротства. Победят те, кто применят ИИ.
Глава Сбера считает, что ИИ не панацея. Большинство отраслей в стране находятся от ИИ на расстоянии миллионов световых лет.
В компаниях нет базовых принципов менеджмента. Поэтому, чтобы там появился ИИ, нужно решить базовые проблемы менеджмента и оцифровать процессы. И только после этого начать внедрять ИИ.
Сегодня в России на повестке дня должна стоять задача по созданию условий, чтобы компании массово подключались/трансформировались с ИИ.
В среднесрочной перспективе в течение 3-5 лет будут массовые банкротства. Победят те, кто применят ИИ.
VK Видео
Развитие экономики: как выйти на оптимальную траекторию роста. Пленарная сессия Финансового конгресса 2025
Финансовый конгресс Банка России 2025 Пленарная сессия «Развитие экономики: как выйти на оптимальную траекторию роста» Российская экономика в 2023–24 гг. продемонстрировала впечатляющий рост вопреки очень значительному осложнению внешнеэкономической обстановки.…
1-й RL-only open source ИИ-агент для программирования, который учится на своем опыте
Together AI и команда Agentica выпустили ИИ- агента для программирования DeepSWE, который построен на базе ИИ- модели Qwen3-32B.
DeepSWE обучен с помощью обучения с подкреплением, т.е. модель учится решать задачи через пробы и ошибки, получая обратную связь от результатов своей работы.
DeepSWE использует rLLM — модульный фреймворк от команды Agentica.
На бенчмарке SWEBench-Verified, где ИИ-агенты решают реальные GitHub issues, DeepSWE показал 42.2% успешных решений с первой попытки и 59% при использовании дополнительного времени на обдумывание.
Together AI и команда Agentica выпустили ИИ- агента для программирования DeepSWE, который построен на базе ИИ- модели Qwen3-32B.
DeepSWE обучен с помощью обучения с подкреплением, т.е. модель учится решать задачи через пробы и ошибки, получая обратную связь от результатов своей работы.
DeepSWE использует rLLM — модульный фреймворк от команды Agentica.
На бенчмарке SWEBench-Verified, где ИИ-агенты решают реальные GitHub issues, DeepSWE показал 42.2% успешных решений с первой попытки и 59% при использовании дополнительного времени на обдумывание.
Telegram
All about AI, Web 3.0, BCI
Together AI introduced DeepSWE is a new SOTA open-source software engineering model trained entirely using reinforcement learning, based on Qwen3-32B.
DeepSWE is trained with rLLM, Agentica’s modular RL post-training framework for agents.
rLLM makes it…
DeepSWE is trained with rLLM, Agentica’s modular RL post-training framework for agents.
rLLM makes it…
Похоже, в Китае развитие ИИ замедлилось, несмотря на изначальный энтузиазм по поводу #DeepSeek @blockchainrf
По иронии судьбы, китайский индекс Terrific 10 значительно уступает американскому Mag 7 после успешных торговых переговоров между США и Китаем в Женеве.
Стоимость акций компании Cambricon, ключевого китайского производителя графических процессоров, когда-то считавшегося китайским ответом Nvidia, резко упала по сравнению с акциями Nvidia.
Падение цены акций Cambricon связано не только с технологическим отставанием, но и с ограничениями в производственных мощностях — Cambricon, будучи в черном списке США, не может использовать передовые технологии TSMC.
Huawei, с другой стороны, имеет большее влияние благодаря своим связям с китайским правительством и доступу к мощностям SMIC. Их чип Ascend 910B лучше подходит для задач вывода,но он всё ещё уступает Nvidia по производительности и экосистеме.
Тем временем долгожданный запуск DeepSeek R2 откладывается, и официальная дата релиза пока неизвестна. Даже если они используют менее мощные чипы, экосистема CUDA от Nvidia все ещё доминирует, а китайские альтернативы - CANN от Huawei, пока не могут конкурировать из-за нестабильности и сложностей в использовании.
Станет ли отсутствие доступа к передовым чипам ИИ непреодолимым препятствием для амбиций Китая в ИИ?
@blockchainrf
По иронии судьбы, китайский индекс Terrific 10 значительно уступает американскому Mag 7 после успешных торговых переговоров между США и Китаем в Женеве.
Стоимость акций компании Cambricon, ключевого китайского производителя графических процессоров, когда-то считавшегося китайским ответом Nvidia, резко упала по сравнению с акциями Nvidia.
Падение цены акций Cambricon связано не только с технологическим отставанием, но и с ограничениями в производственных мощностях — Cambricon, будучи в черном списке США, не может использовать передовые технологии TSMC.
Huawei, с другой стороны, имеет большее влияние благодаря своим связям с китайским правительством и доступу к мощностям SMIC. Их чип Ascend 910B лучше подходит для задач вывода,но он всё ещё уступает Nvidia по производительности и экосистеме.
Тем временем долгожданный запуск DeepSeek R2 откладывается, и официальная дата релиза пока неизвестна. Даже если они используют менее мощные чипы, экосистема CUDA от Nvidia все ещё доминирует, а китайские альтернативы - CANN от Huawei, пока не могут конкурировать из-за нестабильности и сложностей в использовании.
Станет ли отсутствие доступа к передовым чипам ИИ непреодолимым препятствием для амбиций Китая в ИИ?
@blockchainrf
Состояние вычислительных мощностей ИИ: реальные цифры и тренды - свежий отчет.
Объемы инвестиций достигли критической массы. Microsoft, Google и Amazon инвестируют $255 млрд в ИИ-инфраструктуру в 2025 году. Meta* планирует построить дата-центр стоимостью $200+ млрд.
При всем шуме вокруг NVIDIA H100, он используется только в 0.55% всех исследовательских работ по ИИ.
Потенциал роста огромен, но пока большинство исследователей работает на более доступном оборудовании.
Специализация по задачам становится нормой. LLM-исследования концентрируются на AMD MI300/MI250, Huawei Ascend и NVIDIA H100/H200. Робототехника почти полностью перешла на NVIDIA Jetson. Универсальных решений больше нет.
Крупнейшие кластеры ИИ 2025 года:
1. JUPITER Booster (Германия): 24,000 GH200
2. Microsoft Eagle: 14,400 H100
3. Shaheen III (Саудовская Аравия): 2,800 H100
4. Meta: 2 кластера по 24,576 H100 каждый
Общий парк: ~500k H100 и ~111k A100 по всему миру. Meta планирует достичь 350k H100 к концу года.
Неожиданные тренды:
1. Впервые за 6 лет количество исследовательских работ, цитирующих ИИ-чипы, упало на 11%. Возможные причины-консолидация вокруг проверенных решений и рост коммерческих, а не академических проектов.
2. Рост стартапов. Cerebras, Groq, Graphcore и другие ИИ-стартапы показывают +19% роста упоминаний в исследованиях. Пока это капля в море, но тренд указывает на диверсификацию экосистемы.
3. Персидский залив становится новым центром ИИ-вычислений благодаря доступной энергии и капиталу. К 2026 году ожидается заметное присутствие кластеров ОАЭ и Саудовской Аравии в глобальной статистике.
Прогноз: к 2027 году глобальные ИИ-вычислительные мощности вырастут в 10 раз до эквивалента 100 млн H100.
Ведущие ИИ-компании будут контролировать 15-20% всех мировых мощностей каждая.
Эра "гаражных" ИИ-стартапов заканчивается. Входной билет в лигу создателей фронтирных моделей теперь стоит миллиарды долларов.
*запрещенная организация в РФ.
Объемы инвестиций достигли критической массы. Microsoft, Google и Amazon инвестируют $255 млрд в ИИ-инфраструктуру в 2025 году. Meta* планирует построить дата-центр стоимостью $200+ млрд.
При всем шуме вокруг NVIDIA H100, он используется только в 0.55% всех исследовательских работ по ИИ.
Потенциал роста огромен, но пока большинство исследователей работает на более доступном оборудовании.
Специализация по задачам становится нормой. LLM-исследования концентрируются на AMD MI300/MI250, Huawei Ascend и NVIDIA H100/H200. Робототехника почти полностью перешла на NVIDIA Jetson. Универсальных решений больше нет.
Крупнейшие кластеры ИИ 2025 года:
1. JUPITER Booster (Германия): 24,000 GH200
2. Microsoft Eagle: 14,400 H100
3. Shaheen III (Саудовская Аравия): 2,800 H100
4. Meta: 2 кластера по 24,576 H100 каждый
Общий парк: ~500k H100 и ~111k A100 по всему миру. Meta планирует достичь 350k H100 к концу года.
Неожиданные тренды:
1. Впервые за 6 лет количество исследовательских работ, цитирующих ИИ-чипы, упало на 11%. Возможные причины-консолидация вокруг проверенных решений и рост коммерческих, а не академических проектов.
2. Рост стартапов. Cerebras, Groq, Graphcore и другие ИИ-стартапы показывают +19% роста упоминаний в исследованиях. Пока это капля в море, но тренд указывает на диверсификацию экосистемы.
3. Персидский залив становится новым центром ИИ-вычислений благодаря доступной энергии и капиталу. К 2026 году ожидается заметное присутствие кластеров ОАЭ и Саудовской Аравии в глобальной статистике.
Прогноз: к 2027 году глобальные ИИ-вычислительные мощности вырастут в 10 раз до эквивалента 100 млн H100.
Ведущие ИИ-компании будут контролировать 15-20% всех мировых мощностей каждая.
Эра "гаражных" ИИ-стартапов заканчивается. Входной билет в лигу создателей фронтирных моделей теперь стоит миллиарды долларов.
*запрещенная организация в РФ.
www.stateof.ai
State of AI Report Compute Index
The State of AI Report Compute Index tracks the size of public, private and national HPC clusters.
Илья Суцкевер только что: теперь я СЕО SSI
Дэниел Гросс с 29 июня официально больше не является частью SSI. Мы благодарны ему за ранний вклад в компанию и желаем ему успехов в его следующих начинаниях. О Гросс можно прочитать тут.
Теперь я официально являюсь генеральным директором SSI, а Дэниел Леви — президентом. Техническая команда продолжает подчиняться мне.
Вы, возможно, слышали слухи о компаниях, желающих нас приобрести. (Речь идет о Цукерберге). Мы польщены их вниманием, но сосредоточены на том, чтобы довести свою работу до конца.
У нас есть вычислительная техника, у нас есть команда, и мы знаем, что делать. Вместе мы продолжим создавать безопасный сверхинтеллект.
Инвесторы на ранней стадии Ильи тут.
Илья
Дэниел Гросс с 29 июня официально больше не является частью SSI. Мы благодарны ему за ранний вклад в компанию и желаем ему успехов в его следующих начинаниях. О Гросс можно прочитать тут.
Теперь я официально являюсь генеральным директором SSI, а Дэниел Леви — президентом. Техническая команда продолжает подчиняться мне.
Вы, возможно, слышали слухи о компаниях, желающих нас приобрести. (Речь идет о Цукерберге). Мы польщены их вниманием, но сосредоточены на том, чтобы довести свою работу до конца.
У нас есть вычислительная техника, у нас есть команда, и мы знаем, что делать. Вместе мы продолжим создавать безопасный сверхинтеллект.
Инвесторы на ранней стадии Ильи тут.
Илья
Экономика ИИ меняется: от подписок к оплате за результат. Низкая цена больше не гарантирует успех.
Исследование SemiAnalysis показывает структурные изменения в ИИ-индустрии на примере #DeepSeek , Anthropic , Google, OpenAI и др. конкурентов.
DeepSeek R1 предлагает цены в 10 раз ниже OpenAI ($0.55 vs $5+ за входные токены). Что привело к таким результатам:
- Трафик на собственной платформе падает
- Использование на сторонних сервисах растёт в 20 раз.
Причина - компания жертвует качеством обслуживания (25-секундные задержки, малое контекстное окно 64К) ради экономии ресурсов для исследований. Пользователи выбирают те же модели у других провайдеров с лучшими параметрами.
Новая математика эффективности
Anthropic столкнулась с дефицитом мощностей — скорость Claude упала на 40%. Но компания компенсирует это эффективностью - Claude использует в 3 раза меньше токенов для того же ответа
В результате, несмотря на 45 токенов/сек против 100+ у конкурентов, общее время ответа остаётся конкурентным.
Это меняет метрику успеха - важна не скорость генерации, а эффективность использования каждого токена.
Дефицит как новая реальность
Все игроки рынка ограничены вычислительными ресурсами:
1. DeepSeek: 10,000 GPU под санкциями
2. Anthropic: сделки с Amazon и Google на чипы
3. OpenAI и Google: борьба за доступные мощности.
Это создаёт разные стратегии оптимизации, где каждая компания выбирает свой компромисс между ценой, скоростью и качеством.
Переход к токенам как сервису
Растёт сегмент b2b-клиентов (Cursor, Perplexity, Replit), которые:
- Покупают токены для конкретных задач, а не общие подписки
- Легко переключаются между провайдерами
- Оптимизируют использование под свои нужды
Это фундаментально меняет экономику: от фиксированных месячных платежей к переменным затратам на "единицы мышления".
Практические выводы:
Цена токена — результат технических компромиссов, а не показатель эффективности технологии.
Специализация побеждает универсальность: инструменты для конкретных задач (кодирование, поиск) востребованнее общих чат-ботов.
Open source как обход ограничений: китайские компании открывают код, чтобы западные провайдеры тратили свои ресурсы на хостинг.
Эффективность важнее скорости: модели, решающие задачи с меньшим количеством токенов, получают преимущество.
В новой экономике ИИ успех определяется не ценой за токен, а способностью доставить результат с оптимальным балансом скорости, качества и стоимости.
Исследование SemiAnalysis показывает структурные изменения в ИИ-индустрии на примере #DeepSeek , Anthropic , Google, OpenAI и др. конкурентов.
DeepSeek R1 предлагает цены в 10 раз ниже OpenAI ($0.55 vs $5+ за входные токены). Что привело к таким результатам:
- Трафик на собственной платформе падает
- Использование на сторонних сервисах растёт в 20 раз.
Причина - компания жертвует качеством обслуживания (25-секундные задержки, малое контекстное окно 64К) ради экономии ресурсов для исследований. Пользователи выбирают те же модели у других провайдеров с лучшими параметрами.
Новая математика эффективности
Anthropic столкнулась с дефицитом мощностей — скорость Claude упала на 40%. Но компания компенсирует это эффективностью - Claude использует в 3 раза меньше токенов для того же ответа
В результате, несмотря на 45 токенов/сек против 100+ у конкурентов, общее время ответа остаётся конкурентным.
Это меняет метрику успеха - важна не скорость генерации, а эффективность использования каждого токена.
Дефицит как новая реальность
Все игроки рынка ограничены вычислительными ресурсами:
1. DeepSeek: 10,000 GPU под санкциями
2. Anthropic: сделки с Amazon и Google на чипы
3. OpenAI и Google: борьба за доступные мощности.
Это создаёт разные стратегии оптимизации, где каждая компания выбирает свой компромисс между ценой, скоростью и качеством.
Переход к токенам как сервису
Растёт сегмент b2b-клиентов (Cursor, Perplexity, Replit), которые:
- Покупают токены для конкретных задач, а не общие подписки
- Легко переключаются между провайдерами
- Оптимизируют использование под свои нужды
Это фундаментально меняет экономику: от фиксированных месячных платежей к переменным затратам на "единицы мышления".
Практические выводы:
Цена токена — результат технических компромиссов, а не показатель эффективности технологии.
Специализация побеждает универсальность: инструменты для конкретных задач (кодирование, поиск) востребованнее общих чат-ботов.
Open source как обход ограничений: китайские компании открывают код, чтобы западные провайдеры тратили свои ресурсы на хостинг.
Эффективность важнее скорости: модели, решающие задачи с меньшим количеством токенов, получают преимущество.
В новой экономике ИИ успех определяется не ценой за токен, а способностью доставить результат с оптимальным балансом скорости, качества и стоимости.
SemiAnalysis
DeepSeek Debrief: >128 Days Later
SemiAnalysis is hiring an analyst in New York City for Core Research, our world class research product for the finance industry. Please apply here It’s been a bit over 150 days since the launc…
В.Бутерин выступил против сбора биометрических данных у людей
Основатель Ethereum Виталик Бутерин в своей свежей статье высказался против централизованных биометрических систем в контексте цифровой идентификации.
Вот его основные претензии:
1. биометрические данные могут быть
•Подделаны
•Использованы во вред
•Скомпрометированы при утечке баз данных
2. Даже при использовании ZK-технологий, сканирование радужки глаза может позволить третьим сторонам проверять наличие World ID у пользователя, что раскрывает больше информации, чем необходимо.
3. В отличие от паролей, биометрические данные нельзя изменить. Если они скомпрометированы, человек не может получить "новые отпечатки пальцев" или "новую сетчатку".
Виталик приводит в пример проект World ID (ранее Worldcoin), созданный Сэмом Альтманом и Алексом Бланией, где уже зарегистрировано более 13 миллионов пользователей. Этот проект использует сканирование сетчатки для подтверждения «человечности» и выдачи уникального идентификатора. Несмотря на использование ZK-SNARK для защиты данных, Бутерин видит в нём угрозу анонимности, так как он ориентирован на модель «один ID на человека». Он также упоминает инициативы в ЕС и Тайване, которые следуют схожим принципам, подчёркивая, что глобальный тренд к унифицированным ID-системам может быть опасен.
Бутерин предпочитает плюралистический подход, где биометрия может быть одним из многих методов верификации, но не доминирующим или обязательным.
Основатель Ethereum Виталик Бутерин в своей свежей статье высказался против централизованных биометрических систем в контексте цифровой идентификации.
Вот его основные претензии:
1. биометрические данные могут быть
•Подделаны
•Использованы во вред
•Скомпрометированы при утечке баз данных
2. Даже при использовании ZK-технологий, сканирование радужки глаза может позволить третьим сторонам проверять наличие World ID у пользователя, что раскрывает больше информации, чем необходимо.
3. В отличие от паролей, биометрические данные нельзя изменить. Если они скомпрометированы, человек не может получить "новые отпечатки пальцев" или "новую сетчатку".
Виталик приводит в пример проект World ID (ранее Worldcoin), созданный Сэмом Альтманом и Алексом Бланией, где уже зарегистрировано более 13 миллионов пользователей. Этот проект использует сканирование сетчатки для подтверждения «человечности» и выдачи уникального идентификатора. Несмотря на использование ZK-SNARK для защиты данных, Бутерин видит в нём угрозу анонимности, так как он ориентирован на модель «один ID на человека». Он также упоминает инициативы в ЕС и Тайване, которые следуют схожим принципам, подчёркивая, что глобальный тренд к унифицированным ID-системам может быть опасен.
Бутерин предпочитает плюралистический подход, где биометрия может быть одним из многих методов верификации, но не доминирующим или обязательным.
Дуров запустил программу получения golden visa с ОАЭ за стейкинг токенов
Toncoin, криптовалюта, Павла Дурова объявила о партнерстве с ОАЭ о запуске программы, позволяющей инвесторам получать 10-летнюю «Золотую визу» ОАЭ через стейкинг (хранение) токенов TON.
Для этого нужно застейкать $100,000 в токенах TON (~ 34,482 TON по текущей цене ~$2.90) через смарт-контракт на блокчейне TON. Срок стейкинга — минимум 3 года, с возможностью вернуть токены после. Разовая плата $35,000 за обработку заявки. Итог - 10-летняя «Золотая виза» ОАЭ для заявителя и его семьи.
Что дает «Золотая виза»?
- Право жить, работать и учиться в ОАЭ без спонсора.
- Возможность спонсировать семью.
- Отсутствие требования постоянно проживать в стране для сохранения статуса.
- Доступ к инфраструктуре ОАЭ: образование, здравоохранение, бизнес-возможности.
Что это дает ОАЭ?
1. Привлечение капитала через сборы и косвенные инвестиции новых резидентов.
2. ОАЭ укрепляет статус хаба для криптоинноваций, привлекая разработчиков и стартапы в экосистему TON.
Что получает TON?
- повышение спроса на Toncoin и укрепление его утилитарной ценности.
- PR для аудитории Telegram и блокчейна TON.
Риски и вопросы:
1. Цена токена может колебаться, что влияет на стоимость инвестиции.
2. Стейкинг на 3 года требует уверенности в стабильности проекта.
3. Пока программа поддерживается ОАЭ, но любые изменения в криптозаконодательстве могут повлиять на ее будущее.
Toncoin, криптовалюта, Павла Дурова объявила о партнерстве с ОАЭ о запуске программы, позволяющей инвесторам получать 10-летнюю «Золотую визу» ОАЭ через стейкинг (хранение) токенов TON.
Для этого нужно застейкать $100,000 в токенах TON (~ 34,482 TON по текущей цене ~$2.90) через смарт-контракт на блокчейне TON. Срок стейкинга — минимум 3 года, с возможностью вернуть токены после. Разовая плата $35,000 за обработку заявки. Итог - 10-летняя «Золотая виза» ОАЭ для заявителя и его семьи.
Что дает «Золотая виза»?
- Право жить, работать и учиться в ОАЭ без спонсора.
- Возможность спонсировать семью.
- Отсутствие требования постоянно проживать в стране для сохранения статуса.
- Доступ к инфраструктуре ОАЭ: образование, здравоохранение, бизнес-возможности.
Что это дает ОАЭ?
1. Привлечение капитала через сборы и косвенные инвестиции новых резидентов.
2. ОАЭ укрепляет статус хаба для криптоинноваций, привлекая разработчиков и стартапы в экосистему TON.
Что получает TON?
- повышение спроса на Toncoin и укрепление его утилитарной ценности.
- PR для аудитории Telegram и блокчейна TON.
Риски и вопросы:
1. Цена токена может колебаться, что влияет на стоимость инвестиции.
2. Стейкинг на 3 года требует уверенности в стабильности проекта.
3. Пока программа поддерживается ОАЭ, но любые изменения в криптозаконодательстве могут повлиять на ее будущее.
Coincu
Toncoin Offers UAE Golden Visas for $100,000 Pledge
Toncoin teams up with UAE to offer Golden Visas for $100,000 TON investment, unlocking after 3 years.
Итоги уходящей недели, то, что имеет значение в России и мире
ИИ
Anthropic изучает экономику будущего с ИИ, запустив программу исследований влияния ИИ на экономику.
Microsoft приближается к медицинскому AGI — представлена система MAI-DxO.
Цукерберг собрал команду для создания сверхразумного ИИ. Интересные подробности об этом тут и тут.
Илья Суцкевер стал CEO своей компании после перехода Д. Гросса в команду Цукерберга.
Baidu запускает конкурента DeepSeek.
Google сделал свой ИИ бесплатным для образовательного сообщества.
Sakana AI создала коллективный ИИ, заставляя модели работать как единая команда для решения сложных задач.
1-й open source ИИ-агент, основанный исключительно на обучении с подкреплением и способный учиться на собственном опыте.
Новая работа Йошуа Бенжио, где он говорит о рассуждающем ИИ.
Экономика ИИ меняется кардинально — исследование
Нейротехнологии
Маск анонсировал возможность ментального управления роботами через нейроинтерфейс.
Создан неинвазивный мозг-компьютер для управления роботической рукой на уровне отдельных пальцев через ЭЭГ.
Корпоративные стратегии
OpenAI приобрела Crossing Minds, специализирующихся на ИИ-рекомендациях для электронной коммерции.
Amazon оптимизирует склады с помощью ИИ — система DeepFleet ускоряет маршрутизацию складских роботов на 10%.
Мenlo Ventures опубликовал инвестиционный отчет об ИИ-проектах.
Huawei выпускает модель на собственных GPU.
Meta* представила новый подход к курированию данных для развития общих способностей рассуждения в ИИ-системах.
Госрегулирование
Греф предупреждает о массовых банкротствах среди российских компаний через 3-5 лет в случае неадаптации ИИ.
Ужесточение требований к российским чипам.
Греф не видит перспектив развития национальной цифровой валюты.
Криптовалюты и блокчейн
BlackRock: биткоин обгоняет S&P 500.
Казахстан создает криптовалютный госрезерв —
Deutsche Bank, Galaxy Digital и Flow Traders объединяются для создания стейблкоина, привязанного к евро.
Дуров предлагает получение "золотой визы" ОАЭ за стейкинг токенов.
Виталик Бутерин, создатель Ethereum, выступил против централизованных биометрических систем цифровой идентификации.
Circle эмитент стейблкоинов хочет создать "First National Digital Currency Bank" в США.
Исследования и разработки
Тест на "базовые знания" для ИИ — представлен бенчмарк CoreCognition для оценки фундаментальных когнитивных способностей языковых моделей.
HuggingFace объявили о челлендже по использованию ИИ для развития термоядерных технологий совместно с Proxima Fusion.
Карпатый, Nvidia и Meta о будущем ИИ-агентов.
Отчет о состоянии вычислительных мощностей ИИ.
*запрещенная организация в РФ.
ИИ
Anthropic изучает экономику будущего с ИИ, запустив программу исследований влияния ИИ на экономику.
Microsoft приближается к медицинскому AGI — представлена система MAI-DxO.
Цукерберг собрал команду для создания сверхразумного ИИ. Интересные подробности об этом тут и тут.
Илья Суцкевер стал CEO своей компании после перехода Д. Гросса в команду Цукерберга.
Baidu запускает конкурента DeepSeek.
Google сделал свой ИИ бесплатным для образовательного сообщества.
Sakana AI создала коллективный ИИ, заставляя модели работать как единая команда для решения сложных задач.
1-й open source ИИ-агент, основанный исключительно на обучении с подкреплением и способный учиться на собственном опыте.
Новая работа Йошуа Бенжио, где он говорит о рассуждающем ИИ.
Экономика ИИ меняется кардинально — исследование
Нейротехнологии
Маск анонсировал возможность ментального управления роботами через нейроинтерфейс.
Создан неинвазивный мозг-компьютер для управления роботической рукой на уровне отдельных пальцев через ЭЭГ.
Корпоративные стратегии
OpenAI приобрела Crossing Minds, специализирующихся на ИИ-рекомендациях для электронной коммерции.
Amazon оптимизирует склады с помощью ИИ — система DeepFleet ускоряет маршрутизацию складских роботов на 10%.
Мenlo Ventures опубликовал инвестиционный отчет об ИИ-проектах.
Huawei выпускает модель на собственных GPU.
Meta* представила новый подход к курированию данных для развития общих способностей рассуждения в ИИ-системах.
Госрегулирование
Греф предупреждает о массовых банкротствах среди российских компаний через 3-5 лет в случае неадаптации ИИ.
Ужесточение требований к российским чипам.
Греф не видит перспектив развития национальной цифровой валюты.
Криптовалюты и блокчейн
BlackRock: биткоин обгоняет S&P 500.
Казахстан создает криптовалютный госрезерв —
Deutsche Bank, Galaxy Digital и Flow Traders объединяются для создания стейблкоина, привязанного к евро.
Дуров предлагает получение "золотой визы" ОАЭ за стейкинг токенов.
Виталик Бутерин, создатель Ethereum, выступил против централизованных биометрических систем цифровой идентификации.
Circle эмитент стейблкоинов хочет создать "First National Digital Currency Bank" в США.
Исследования и разработки
Тест на "базовые знания" для ИИ — представлен бенчмарк CoreCognition для оценки фундаментальных когнитивных способностей языковых моделей.
HuggingFace объявили о челлендже по использованию ИИ для развития термоядерных технологий совместно с Proxima Fusion.
Карпатый, Nvidia и Meta о будущем ИИ-агентов.
Отчет о состоянии вычислительных мощностей ИИ.
*запрещенная организация в РФ.
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Дуров запустил программу получения golden visa с ОАЭ за стейкинг токенов Toncoin, криптовалюта, Павла Дурова объявила о партнерстве с ОАЭ о запуске программы, позволяющей инвесторам получать 10-летнюю «Золотую визу» ОАЭ через стейкинг (хранение) токенов TON.…
ОАЭ отрицают совместную программу с Дуровым по золотой визе, которую можно получить за стейкинг токенов TON
Власти ОАЭ (ICP, SCA и VARA) опровергли вчерашнюю информацию, заявив, что это «ложные слухи», а инвестиции в цифровые валюты не дают права на визу.
Они также отметили, что TON не лицензирован VARA.
Вчерашний анонс, который кроме СМИ был опубликован на сайте TON, вероятно, был сделан без согласования с властями ОАЭ, после чего пользователи соцсетей высказали недоверие к проектам, связанным с Дуровым. В частности TON теперь связывают со скамом. Это большой ущерб по репутации как Дурова, так и его проектов.
Напомним, что 28 мая Дуров объявил о партнерстве Telegram с xAI для интеграции Grok в Telegram, заявив, что это даст доступ к ИИ более чем миллиарду пользователей. Он также упомянул, что Telegram получит $300 млн в виде денег и акций от xAI, плюс 50% дохода от подписок xAI, проданных через Telegram.
А Маск быстро опроверг это, написав на X: «No deal has been signed» («Сделка не подписана»), что поставило под сомнение заявление Дурова.
Позже в СМИ отмечалось, что переговоры, возможно, велись, но сделка не была финализирована.
Власти ОАЭ (ICP, SCA и VARA) опровергли вчерашнюю информацию, заявив, что это «ложные слухи», а инвестиции в цифровые валюты не дают права на визу.
Они также отметили, что TON не лицензирован VARA.
Вчерашний анонс, который кроме СМИ был опубликован на сайте TON, вероятно, был сделан без согласования с властями ОАЭ, после чего пользователи соцсетей высказали недоверие к проектам, связанным с Дуровым. В частности TON теперь связывают со скамом. Это большой ущерб по репутации как Дурова, так и его проектов.
Напомним, что 28 мая Дуров объявил о партнерстве Telegram с xAI для интеграции Grok в Telegram, заявив, что это даст доступ к ИИ более чем миллиарду пользователей. Он также упомянул, что Telegram получит $300 млн в виде денег и акций от xAI, плюс 50% дохода от подписок xAI, проданных через Telegram.
А Маск быстро опроверг это, написав на X: «No deal has been signed» («Сделка не подписана»), что поставило под сомнение заявление Дурова.
Позже в СМИ отмечалось, что переговоры, возможно, велись, но сделка не была финализирована.
Emirates News Agency
No golden visa for digital currency investors in UAE, authorities clarify
The Federal Authority for Identity, Citizenship, Customs and Port Security (ICP), the Securities and Commodities Authority (SCA), and the Virtual Assets Regulatory Authority (VARA) have issued a joint statement denying reports circulating on certain websites…
EPFL выяснили, что ведущие LLM плохо понимают визуальную информацию
Исследователи протестировали GPT-4o, Claude 3.5 Sonnet, Gemini, Llama и др. на стандартных задачах компьютерного зрения: сегментация, оценка глубины и др., используя известные датасеты (COCO, ImageNet).
Хотя эти модели показывают большой прогресс, их реальное понимание визуальной информации, например, геометрии объектов не такое качественное.
Основные итоги:
1. Мультимодальные модели — хорошие "универсалы", но уступают специализированным. Они хуже решают конкретные задачи, например, сегментацию, чем узкоспециализированные модели, но всё равно показывают достойные результаты, учитывая, что обучались в основном на текстово-изображенческих данных.
Лучше справляются с семантикой, чем с геометрией.
2. Рассуждающие модели, например, o3 лучше в геометрических задачах.
3. Генеративные модели для изображений, например, GPT-4o Image Generation пока ненадежны для точных задач.
Исследователи протестировали GPT-4o, Claude 3.5 Sonnet, Gemini, Llama и др. на стандартных задачах компьютерного зрения: сегментация, оценка глубины и др., используя известные датасеты (COCO, ImageNet).
Хотя эти модели показывают большой прогресс, их реальное понимание визуальной информации, например, геометрии объектов не такое качественное.
Основные итоги:
1. Мультимодальные модели — хорошие "универсалы", но уступают специализированным. Они хуже решают конкретные задачи, например, сегментацию, чем узкоспециализированные модели, но всё равно показывают достойные результаты, учитывая, что обучались в основном на текстово-изображенческих данных.
Лучше справляются с семантикой, чем с геометрией.
2. Рассуждающие модели, например, o3 лучше в геометрических задачах.
3. Генеративные модели для изображений, например, GPT-4o Image Generation пока ненадежны для точных задач.
Облачный провайдер для ИИ CoreWeave покупает Core Scientific - крупный оператор дата-центров, занимающийся майнингом криптовалют и HPC-инфраструктурой
Закрытие сделки ожидается в 4 квартале 2025.
CoreWeave получит 1,3 ГВт мощности дата-центров Core Scientific, $500 млн ежегодной экономии к 2027 году. Часть мощностей Core Scientific, ранее занятых майнингом, будет перепрофилирована под HPC и ИИ.
CoreWeave усилит позиции на рынке ИИ-облаков, снизит зависимость от аренды дата-центров.
А Core Scientific избавится от рисков, связанных с волатильностью крипторынка, и получит выход на растущий сектор ИИ.
Закрытие сделки ожидается в 4 квартале 2025.
CoreWeave получит 1,3 ГВт мощности дата-центров Core Scientific, $500 млн ежегодной экономии к 2027 году. Часть мощностей Core Scientific, ранее занятых майнингом, будет перепрофилирована под HPC и ИИ.
CoreWeave усилит позиции на рынке ИИ-облаков, снизит зависимость от аренды дата-центров.
А Core Scientific избавится от рисков, связанных с волатильностью крипторынка, и получит выход на растущий сектор ИИ.
Businesswire
CoreWeave to Acquire Core Scientific
CoreWeave (NASDAQ: CRWV), the AI Hyperscaler™, and Core Scientific (NASDAQ: CORZ), a leading data center infrastructure provider, today announced that they h...
MIT предлагает систему измерения экономики, которая учитывает людей и ИИ-агентов.
Предполагается, что в ближайшее десятилетие человечеству придется координировать не только миллиарды людей, но и десятки миллиардов ИИ-агентов, действующих от их имени.
Это требует создания новой системы измерения - "Агентной переписи".
Сейчас ИИ-агенты выполняют относительно простые задачи - помогают писать код, отвечают на вопросы, анализируют данные. Но каждый месяц эти агенты становятся более способными.
Автор описывает потенциальный сценарий в Северной Каролине, где ИИ-агенты начинают выполнять рутинные задачи программирования в Исследовательском треугольнике. Сначала это просто делает программистов более продуктивными. Но по мере того, как агенты становятся лучше, компаниям нужно меньше инженеров. Некоторые разработчики теряют работу, другие переезжают туда, где остается высокоуровневая работа. Это создает цепную реакцию, затрагивающую местные рестораны, услуги, жилищный спрос, работников сферы обслуживания.
Традиционные статистические системы не имеют системы для измерения возможностей ИИ-агентов или их экономического влияния.
Решение MIT - Большие популяционные модели (LPM), которые могут симулировать миллионы отдельных людей, взаимодействующих в реалистичных экономических условиях. LPM уже работают с традиционными данными переписи и могут моделировать различные сценарии экономических изменений.
Недостающее звено - данные о популяции агентов. Для решения этой проблемы создается NANDA Registry - инфраструктура для идентификации агентов, каталогизации их возможностей и мониторинга того, как они координируются с людьми и другими агентами.
Проект Iceberg объединяет традиционные данные переписи о работниках с данными о возможностях агентов из NANDA Registry, затем использует LPM для симуляции трансформации рабочей силы во всех 50 штатах.
Автор предупреждает, если мы не построим публичную инфраструктуру для Агентной переписи, частные платформы будут контролировать эту информацию исключительно. Компании, создающие ИИ-агентов, будут видеть экономические сбои раньше местных лидеров.
Предполагается, что в ближайшее десятилетие человечеству придется координировать не только миллиарды людей, но и десятки миллиардов ИИ-агентов, действующих от их имени.
Это требует создания новой системы измерения - "Агентной переписи".
Сейчас ИИ-агенты выполняют относительно простые задачи - помогают писать код, отвечают на вопросы, анализируют данные. Но каждый месяц эти агенты становятся более способными.
Автор описывает потенциальный сценарий в Северной Каролине, где ИИ-агенты начинают выполнять рутинные задачи программирования в Исследовательском треугольнике. Сначала это просто делает программистов более продуктивными. Но по мере того, как агенты становятся лучше, компаниям нужно меньше инженеров. Некоторые разработчики теряют работу, другие переезжают туда, где остается высокоуровневая работа. Это создает цепную реакцию, затрагивающую местные рестораны, услуги, жилищный спрос, работников сферы обслуживания.
Традиционные статистические системы не имеют системы для измерения возможностей ИИ-агентов или их экономического влияния.
Решение MIT - Большие популяционные модели (LPM), которые могут симулировать миллионы отдельных людей, взаимодействующих в реалистичных экономических условиях. LPM уже работают с традиционными данными переписи и могут моделировать различные сценарии экономических изменений.
Недостающее звено - данные о популяции агентов. Для решения этой проблемы создается NANDA Registry - инфраструктура для идентификации агентов, каталогизации их возможностей и мониторинга того, как они координируются с людьми и другими агентами.
Проект Iceberg объединяет традиционные данные переписи о работниках с данными о возможностях агентов из NANDA Registry, затем использует LPM для симуляции трансформации рабочей силы во всех 50 штатах.
Автор предупреждает, если мы не построим публичную инфраструктуру для Агентной переписи, частные платформы будут контролировать эту информацию исключительно. Компании, создающие ИИ-агентов, будут видеть экономические сбои раньше местных лидеров.
MIT Media Lab
The Invisible Economy: Why We Need an Agentic Census – MIT Media Lab
Billions of AI agents will reshape society—and why we need to start measuring before it happens- Ayush Chopra, PhD Candidate MIT (media.mit.edu/~ayushc)Every t…
Google готовится к 1-м клиническим испытаниям на людях препаратов, разработанных с ИИ
Препараты, созданные с помощью ИИ, в Isomorphic Labs, дочерней компании Google DeepMind находятся на финальной стадии подготовки к испытаниям на людях, с акцентом на онкологические заболевания.
Компания, основанная в 2021 году, опирается на технологию AlphaFold, которая позволяет предсказывать структуру белков и их взаимодействие с молекулами. Это открывает новые возможности для создания лекарств, особенно в онкологии и иммунологии.
В апреле 2025 года Isomorphic Labs привлекла $600 млн в 1-м внешнем раунде инвестиций , который возглавила Thrive Capital при участии Google Ventures и Alphabet.
Также компания сотрудничает с Novartis и Eli Lilly в рамках соглашений общей стоимостью до $3 млрд , включая авансовые платежи на $82 млн.
Технология AlphaFold 3, представленная в 2024 году, позволяет моделировать сложные биологические процессы, включая взаимодействия белков, ДНК, РНК и малых молекул. Это дает Isomorphic Labs преимущество в разработке новых соединений, хотя успех испытаний остается под вопросом, учитывая, что только около 10% препаратов проходят клинические этапы.
Препараты, созданные с помощью ИИ, в Isomorphic Labs, дочерней компании Google DeepMind находятся на финальной стадии подготовки к испытаниям на людях, с акцентом на онкологические заболевания.
Компания, основанная в 2021 году, опирается на технологию AlphaFold, которая позволяет предсказывать структуру белков и их взаимодействие с молекулами. Это открывает новые возможности для создания лекарств, особенно в онкологии и иммунологии.
В апреле 2025 года Isomorphic Labs привлекла $600 млн в 1-м внешнем раунде инвестиций , который возглавила Thrive Capital при участии Google Ventures и Alphabet.
Также компания сотрудничает с Novartis и Eli Lilly в рамках соглашений общей стоимостью до $3 млрд , включая авансовые платежи на $82 млн.
Технология AlphaFold 3, представленная в 2024 году, позволяет моделировать сложные биологические процессы, включая взаимодействия белков, ДНК, РНК и малых молекул. Это дает Isomorphic Labs преимущество в разработке новых соединений, хотя успех испытаний остается под вопросом, учитывая, что только около 10% препаратов проходят клинические этапы.
Fortune
Isomorphic Labs has grand ambitions to 'solve all diseases' with AI. Now, it's gearing up for its first human trials
“One day we hope to be able to say — well, here’s a disease, and then click a button and out pops the design for a drug to address that disease.”
Маск говорит, что к концу 2026 будет создана ИИ полностью видеоигра уровня AAA. Напомним, что его компания xAI начала разрабатывать игры.
СЕО DeepMind Демис Хассабис сделал похожий комментарий об играх, созданных с их моделью Veo 3 на прошлой неделе. Более того, у Google есть Genie2.
Прогнозируется, что мировой игровой рынок превысит $600 млрд к концу этого десятилетия. Он намного больше Голливуда.
СЕО DeepMind Демис Хассабис сделал похожий комментарий об играх, созданных с их моделью Veo 3 на прошлой неделе. Более того, у Google есть Genie2.
Прогнозируется, что мировой игровой рынок превысит $600 млрд к концу этого десятилетия. Он намного больше Голливуда.