Meta* опубликовала работу о воплощённых AI-агентах, способных действовать в физическом и виртуальном мирах
В отличие от чат-ботов, воплощённые агенты имеют форму — от VR-аватаров до умных очков и роботов. Их цель — действовать автономно, понимать людей и мир, прогнозировать возможные последствия и помогать в реальных задачах.
В центре архитектуры — «модель мира» (world model), которая заменяет генерацию текста или пикселей на предсказание действий и состояний в абстрактном пространстве. Это позволяет моделям создавать планы, обучаться без надзора со стороны человека и действовать в реальном времени.
Разработаны 2 типа таких моделей: модели первого типа распознают динамику, объекты, причинно-следственные связи, а второго — цели, эмоции и убеждения людей.
В работе представлены 3 класса агентов:
• виртуальные — аватары в VR/AR, NPC, ассистенты;
• носимые — AI в очках, способный понимать контекст ситуаций и подсказывать пользователю информацию в реальном времени;
• робототехнические — физические агенты, способные к манипуляциям с объектами и обучению на месте.
Существенные новации — эпизодическая память, которая необходима для долгосрочного удержания контекста, переход от генеративных моделей к предиктивным,например, V-JEPA 2-AC, и бенчмарки для проверки —WorldPrediction, CausalVQA и IntPhys2.
Исследование затрагивает и этические риски: такие агенты могут собирать личные данные и вызывать ложное чувство, будто они «понимают» пользователя. Meta* считает, что решение этих проблем должно быть в фокусе внимания исследователей для будущего развития технологии.
*организация запрещена на территории России и признана экстремистской
#news #AI #бигтехи #роботы
Препринт исследования
В отличие от чат-ботов, воплощённые агенты имеют форму — от VR-аватаров до умных очков и роботов. Их цель — действовать автономно, понимать людей и мир, прогнозировать возможные последствия и помогать в реальных задачах.
В центре архитектуры — «модель мира» (world model), которая заменяет генерацию текста или пикселей на предсказание действий и состояний в абстрактном пространстве. Это позволяет моделям создавать планы, обучаться без надзора со стороны человека и действовать в реальном времени.
Разработаны 2 типа таких моделей: модели первого типа распознают динамику, объекты, причинно-следственные связи, а второго — цели, эмоции и убеждения людей.
В работе представлены 3 класса агентов:
• виртуальные — аватары в VR/AR, NPC, ассистенты;
• носимые — AI в очках, способный понимать контекст ситуаций и подсказывать пользователю информацию в реальном времени;
• робототехнические — физические агенты, способные к манипуляциям с объектами и обучению на месте.
Существенные новации — эпизодическая память, которая необходима для долгосрочного удержания контекста, переход от генеративных моделей к предиктивным,например, V-JEPA 2-AC, и бенчмарки для проверки —WorldPrediction, CausalVQA и IntPhys2.
Исследование затрагивает и этические риски: такие агенты могут собирать личные данные и вызывать ложное чувство, будто они «понимают» пользователя. Meta* считает, что решение этих проблем должно быть в фокусе внимания исследователей для будущего развития технологии.
*организация запрещена на территории России и признана экстремистской
#news #AI #бигтехи #роботы
Препринт исследования
👍1
AI-браузеры становятся новым стандартом: OpenAI и Perplexity бросают вызов Google Chrome
OpenAI и Perplexity почти одновременно объявили о запуске собственных браузеров с AI. Вероятно, эпоха классического интернет-сёрфинга уступает место агентному взаимодействию и персонализированной навигации.
Браузер от OpenAI, построенный на движке Chromium и глубоко интегрированный с ChatGPT, будет не просто интерфейсом для доступа в интернет, а агентной платформой, способной выполнять действия от имени пользователя. Учитывая, что число активных пользователей ChatGPT достигло 500 млн в неделю, подобный проект ставит под вопрос гегемонию Google Chrome. Для Google отток аудитории является критичным: браузер компании является ключевым источником пользовательских данных, на которых строится рекламная модель всей экосистемы Alphabet.
Параллельно стартап Perplexity, поддерживаемый Nvidia, основателем Amazon Джеффом Безосом и SoftBank, представил Comet: AI-браузер, который умеет сравнивать товары, анализировать информацию, может интегрироваться со Slack и отвечать на запросы голосом или текстом. Сейчас он доступен подписчикам Perplexity Max за $200 в месяц, а летом начнёт распространяться по системе приглашений.
Обе компании позиционируют браузеры не просто как альтернативу Chrome или Safari, но позиционируют их как платформы для агентных AI-помощников. На фоне давления на Google со стороны антимонопольных органов и усиливающейся конкуренции с OpenAI и Perplexity, становится ясно: AI-браузер — это не дополнение, а новая точка входа в цифровой мир.
#news #AI #бигтехи #стартапы
https://www.reuters.com/business/media-telecom/openai-release-web-browser-challenge-google-chrome-2025-07-09/
OpenAI и Perplexity почти одновременно объявили о запуске собственных браузеров с AI. Вероятно, эпоха классического интернет-сёрфинга уступает место агентному взаимодействию и персонализированной навигации.
Браузер от OpenAI, построенный на движке Chromium и глубоко интегрированный с ChatGPT, будет не просто интерфейсом для доступа в интернет, а агентной платформой, способной выполнять действия от имени пользователя. Учитывая, что число активных пользователей ChatGPT достигло 500 млн в неделю, подобный проект ставит под вопрос гегемонию Google Chrome. Для Google отток аудитории является критичным: браузер компании является ключевым источником пользовательских данных, на которых строится рекламная модель всей экосистемы Alphabet.
Параллельно стартап Perplexity, поддерживаемый Nvidia, основателем Amazon Джеффом Безосом и SoftBank, представил Comet: AI-браузер, который умеет сравнивать товары, анализировать информацию, может интегрироваться со Slack и отвечать на запросы голосом или текстом. Сейчас он доступен подписчикам Perplexity Max за $200 в месяц, а летом начнёт распространяться по системе приглашений.
Обе компании позиционируют браузеры не просто как альтернативу Chrome или Safari, но позиционируют их как платформы для агентных AI-помощников. На фоне давления на Google со стороны антимонопольных органов и усиливающейся конкуренции с OpenAI и Perplexity, становится ясно: AI-браузер — это не дополнение, а новая точка входа в цифровой мир.
#news #AI #бигтехи #стартапы
https://www.reuters.com/business/media-telecom/openai-release-web-browser-challenge-google-chrome-2025-07-09/
CNBC
Perplexity launches AI-powered web browser for select group of subscribers
Perplexity AI launched a new artificial intelligence-powered web browser called Comet
💅2❤1😁1
Расширение пределов применения AI
Начав с распознавания котиков, ИИ довольно быстро захватил практически все сферы применения, которые можно категоризовать как бизнес-критические (business-critical). Ну в самом деле, рекомендательные системы уже основаны на ИИ и дают отличные результаты. ИИ начинает входит в следующий уровень систем - mission-critical. Там ситуация сложнее - надо доверить ИИ действия за всю организацию. Когда говорят об организации, как множестве ИИ-агентов, действующих автономно, то имеют ввиду именно это. Мы довольно близко подошли к стадии, когда ИИ может взять на себя вещи, которые имеют критическое значение для целей организации. Например, управлять цепочками поставок.
Но когда мы подходим к управлению уровня life-critical. Здесь начинается настоящая сложность. Такого рода управление никогда не бывает полностью автоматизированным. Не только потому, что человек все еще креативней машины, но и потому, что за ошибку человека можно посадить, а вот машину нет. Однако, попытки взяться за решение life-critical задач постоянно идут. 20 лет уже прошлом с момента первых автономных машин на ИИ, и мы лишь только приблизились к первым масштабным внедрениям робо-такси. Два десятилетия понадобились для этого.
Самая аварийная часть авиационного перелета - взлет и посадка - находится под жестким, алгоритмическим управлением связки пилот и диспетчер. Но воздушное пространство до 1 000 м (низковысотная экономика) скоро будет наполнено миллионами машин. Диспетчеры просто не будут справляться с растущим уровнем сложности. Хотя до автономизации работы диспетчера еще далеко, регуляторы не оставляют таких попыток.
В Великобритании идут испытания системы Aimee, системы, которая предназначена для помощи авиадиспетчерам в загруженных международных аэропортах. Компания Searidge Technologies (автор системы) использует 360-градусные для непрерывного отслеживания положение нескольких воздушных судов, отмечая потенциальные конфликты и побуждая авиадиспетчера сосредоточиться на этой проблеме. Решения об изменении положения или курса самолета сейчас принимаются авиадиспетчером. Но потенциально это может делать Aimee.
Похожую систему развивают в MIT. Система предотвращения столкновений Airborne Collision Prevention System X (ACAS X), которая проходит испытания в этом университете, использует данные искусственного интеллекта и прошла миллионы имитаций опасных ситуаций. Одна из целей ACAS X — снижение количества ложных срабатываний. Она также может предупреждать самолёты о необходимости бокового перемещения в небе. Традиционные системы могут только направлять самолёты на снижение или набор высоты.
Все это исследования и пилоты. Однако, они необходимы, чтобы мы приобрели опыт в том, можем ли мы доверится ИИ в столь сложной области как авиатранспорт.
Начав с распознавания котиков, ИИ довольно быстро захватил практически все сферы применения, которые можно категоризовать как бизнес-критические (business-critical). Ну в самом деле, рекомендательные системы уже основаны на ИИ и дают отличные результаты. ИИ начинает входит в следующий уровень систем - mission-critical. Там ситуация сложнее - надо доверить ИИ действия за всю организацию. Когда говорят об организации, как множестве ИИ-агентов, действующих автономно, то имеют ввиду именно это. Мы довольно близко подошли к стадии, когда ИИ может взять на себя вещи, которые имеют критическое значение для целей организации. Например, управлять цепочками поставок.
Но когда мы подходим к управлению уровня life-critical. Здесь начинается настоящая сложность. Такого рода управление никогда не бывает полностью автоматизированным. Не только потому, что человек все еще креативней машины, но и потому, что за ошибку человека можно посадить, а вот машину нет. Однако, попытки взяться за решение life-critical задач постоянно идут. 20 лет уже прошлом с момента первых автономных машин на ИИ, и мы лишь только приблизились к первым масштабным внедрениям робо-такси. Два десятилетия понадобились для этого.
Самая аварийная часть авиационного перелета - взлет и посадка - находится под жестким, алгоритмическим управлением связки пилот и диспетчер. Но воздушное пространство до 1 000 м (низковысотная экономика) скоро будет наполнено миллионами машин. Диспетчеры просто не будут справляться с растущим уровнем сложности. Хотя до автономизации работы диспетчера еще далеко, регуляторы не оставляют таких попыток.
В Великобритании идут испытания системы Aimee, системы, которая предназначена для помощи авиадиспетчерам в загруженных международных аэропортах. Компания Searidge Technologies (автор системы) использует 360-градусные для непрерывного отслеживания положение нескольких воздушных судов, отмечая потенциальные конфликты и побуждая авиадиспетчера сосредоточиться на этой проблеме. Решения об изменении положения или курса самолета сейчас принимаются авиадиспетчером. Но потенциально это может делать Aimee.
Похожую систему развивают в MIT. Система предотвращения столкновений Airborne Collision Prevention System X (ACAS X), которая проходит испытания в этом университете, использует данные искусственного интеллекта и прошла миллионы имитаций опасных ситуаций. Одна из целей ACAS X — снижение количества ложных срабатываний. Она также может предупреждать самолёты о необходимости бокового перемещения в небе. Традиционные системы могут только направлять самолёты на снижение или набор высоты.
Все это исследования и пилоты. Однако, они необходимы, чтобы мы приобрели опыт в том, можем ли мы доверится ИИ в столь сложной области как авиатранспорт.
Let's Talk Airfield Innovation
AIMEE - Let's Talk Airfield Innovation
AIMEE by Searidge is an advanced AI framework using computer vision, NLP, and predictive models to modernize airport operations and air traffic management.
👍3