Innovation & Research

Meta* опубликовала работу о воплощённых AI-агентах, способных действовать в физическом и виртуальном мирах

В отличие от чат-ботов, воплощённые агенты имеют форму — от VR-аватаров до умных очков и роботов. Их цель — действовать автономно, понимать людей и мир, прогнозировать возможные последствия и помогать в реальных задачах.

В центре архитектуры — «модель мира» (world model), которая заменяет генерацию текста или пикселей на предсказание действий и состояний в абстрактном пространстве. Это позволяет моделям создавать планы, обучаться без надзора со стороны человека и действовать в реальном времени.

Разработаны 2 типа таких моделей: модели первого типа распознают динамику, объекты, причинно-следственные связи, а второго — цели, эмоции и убеждения людей.

В работе представлены 3 класса агентов:

• виртуальные — аватары в VR/AR, NPC, ассистенты;
• носимые — AI в очках, способный понимать контекст ситуаций и подсказывать пользователю информацию в реальном времени;
• робототехнические — физические агенты, способные к манипуляциям с объектами и обучению на месте.

Существенные новации — эпизодическая память, которая необходима для долгосрочного удержания контекста, переход от генеративных моделей к предиктивным,например, V-JEPA 2-AC, и бенчмарки для проверки —WorldPrediction, CausalVQA и IntPhys2.

Исследование затрагивает и этические риски: такие агенты могут собирать личные данные и вызывать ложное чувство, будто они «понимают» пользователя. Meta* считает, что решение этих проблем должно быть в фокусе внимания исследователей для будущего развития технологии.

*организация запрещена на территории России и признана экстремистской

#news #AI #бигтехи #роботы

Препринт исследования

👍1

609 views07:02

AI-браузеры становятся новым стандартом: OpenAI и Perplexity бросают вызов Google Chrome

OpenAI и Perplexity почти одновременно объявили о запуске собственных браузеров с AI. Вероятно, эпоха классического интернет-сёрфинга уступает место агентному взаимодействию и персонализированной навигации.

Браузер от OpenAI, построенный на движке Chromium и глубоко интегрированный с ChatGPT, будет не просто интерфейсом для доступа в интернет, а агентной платформой, способной выполнять действия от имени пользователя. Учитывая, что число активных пользователей ChatGPT достигло 500 млн в неделю, подобный проект ставит под вопрос гегемонию Google Chrome. Для Google отток аудитории является критичным: браузер компании является ключевым источником пользовательских данных, на которых строится рекламная модель всей экосистемы Alphabet.

Параллельно стартап Perplexity, поддерживаемый Nvidia, основателем Amazon Джеффом Безосом и SoftBank, представил Comet: AI-браузер, который умеет сравнивать товары, анализировать информацию, может интегрироваться со Slack и отвечать на запросы голосом или текстом. Сейчас он доступен подписчикам Perplexity Max за $200 в месяц, а летом начнёт распространяться по системе приглашений.

Обе компании позиционируют браузеры не просто как альтернативу Chrome или Safari, но позиционируют их как платформы для агентных AI-помощников. На фоне давления на Google со стороны антимонопольных органов и усиливающейся конкуренции с OpenAI и Perplexity, становится ясно: AI-браузер — это не дополнение, а новая точка входа в цифровой мир.

#news #AI #бигтехи #стартапы

https://www.reuters.com/business/media-telecom/openai-release-web-browser-challenge-google-chrome-2025-07-09/

CNBC

Perplexity launches AI-powered web browser for select group of subscribers

Perplexity AI launched a new artificial intelligence-powered web browser called Comet

💅2❤1😁1

445 views07:02

Innovation & Research

Расширение пределов применения AI

Начав с распознавания котиков, ИИ довольно быстро захватил практически все сферы применения, которые можно категоризовать как бизнес-критические (business-critical). Ну в самом деле, рекомендательные системы уже основаны на ИИ и дают отличные результаты. ИИ начинает входит в следующий уровень систем - mission-critical. Там ситуация сложнее - надо доверить ИИ действия за всю организацию. Когда говорят об организации, как множестве ИИ-агентов, действующих автономно, то имеют ввиду именно это. Мы довольно близко подошли к стадии, когда ИИ может взять на себя вещи, которые имеют критическое значение для целей организации. Например, управлять цепочками поставок.

Но когда мы подходим к управлению уровня life-critical. Здесь начинается настоящая сложность. Такого рода управление никогда не бывает полностью автоматизированным. Не только потому, что человек все еще креативней машины, но и потому, что за ошибку человека можно посадить, а вот машину нет. Однако, попытки взяться за решение life-critical задач постоянно идут. 20 лет уже прошлом с момента первых автономных машин на ИИ, и мы лишь только приблизились к первым масштабным внедрениям робо-такси. Два десятилетия понадобились для этого.

Самая аварийная часть авиационного перелета - взлет и посадка - находится под жестким, алгоритмическим управлением связки пилот и диспетчер. Но воздушное пространство до 1 000 м (низковысотная экономика) скоро будет наполнено миллионами машин. Диспетчеры просто не будут справляться с растущим уровнем сложности. Хотя до автономизации работы диспетчера еще далеко, регуляторы не оставляют таких попыток.

В Великобритании идут испытания системы Aimee, системы, которая предназначена для помощи авиадиспетчерам в загруженных международных аэропортах. Компания Searidge Technologies (автор системы) использует 360-градусные для непрерывного отслеживания положение нескольких воздушных судов, отмечая потенциальные конфликты и побуждая авиадиспетчера сосредоточиться на этой проблеме. Решения об изменении положения или курса самолета сейчас принимаются авиадиспетчером. Но потенциально это может делать Aimee.

Похожую систему развивают в MIT. Система предотвращения столкновений Airborne Collision Prevention System X (ACAS X), которая проходит испытания в этом университете, использует данные искусственного интеллекта и прошла миллионы имитаций опасных ситуаций. Одна из целей ACAS X — снижение количества ложных срабатываний. Она также может предупреждать самолёты о необходимости бокового перемещения в небе. Традиционные системы могут только направлять самолёты на снижение или набор высоты.

Все это исследования и пилоты. Однако, они необходимы, чтобы мы приобрели опыт в том, можем ли мы доверится ИИ в столь сложной области как авиатранспорт.

Let's Talk Airfield Innovation

AIMEE - Let's Talk Airfield Innovation

AIMEE by Searidge is an advanced AI framework using computer vision, NLP, and predictive models to modernize airport operations and air traffic management.

👍3

254 views11:26

2025/07/13 12:39:02
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>