Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
- Telegram Web
Telegram Web
Открыли новую лабораторию — на этот раз вместе с Университетом Иннополис.

Рад сотрудничеству: сильная команда, актуальная тема и реальный потенциал для того, чтобы научные разработки быстрее доходили до практического применения в промышленности.

https://www.tgoop.com/airi_research_institute/878
Стал лауреатом AI AWARDS 2025 в номинации «Личность в ИИ»

Приятно получить награду, основанную на масштабном рейтинге, сформированном именно нейросетью.

Спасибо жюри и команде Билайна за по-настоящему технологичную и актуальную премию. И, конечно, спасибо нейросети, которая выбирала)
Media is too big
VIEW IN TELEGRAM
Вчера выступил в РЭУ им. Г.В. Плеханова на пленарной сессии в рамках Международного научного форума «Шаг в будущее: глобальный форсайт, искусственный интеллект и стратегическое лидерство».

Рассказал про то, что изменилось за год в науке об ИИ. Запись трансляции можно посмотреть по ссылке.

Благодарю коллег за приглашение и интересную дискуссию!
Вышел большой выпуск со мной на канале «Основа» — обсудили главное про искусственный интеллект.

Поговорили о том, что такое рассуждающий ИИ, как далеко до настоящего AGI и какие технологии удивят в ближайшие 5–10 лет. Затронули темы агентных систем, эффекта масштабирования, галлюцинаций, DeepSeek-а, стоимости обучения моделей, а также применения ИИ за пределами чат-ботов, нерешённых задач, ответственности за ошибки нейросетей и многое другое.

Делюсь ссылками на видео: VK Видео, YouTube.

Отдельное спасибо Борису Веденскому — получился живой и насыщенный разговор.
Уверен, что крутые и важные исследования рождаются именно на стыке дисциплин, поэтому приглашаю вас обсудить ИИ и кардиологию на наш следующий Большой Семинар AIRI во вторник 27 мая.

Регистрация и подробности: https://www.tgoop.com/airi_research_institute/886
Forwarded from Институт AIRI
Please open Telegram to view this post
VIEW IN TELEGRAM
Рассказываю про препринт нашей новой статьи, которую написали совместно с моим аспирантом и научным сотрудником AIRI Глебом Мезенцевым.

Оказывается, LLM могут восстанавливать длинные тексты из одного обученного эмбеддинга за один forward-pass — без итеративного декодинга.

Получается, что у LLM есть скрытый талант генерировать сотни слов практически моментально, осталось понять, как этот талант развить :)
Сегодня выступил на Data Fest’25 в офисе Сбера, рассказал про основы обучения больших моделей в эпоху ризонинга.

На мероприятии все залы были полные, интерес к теме чувствовался с первых минут. После доклада задавали много вопросов, а в перерывах обсуждали с участниками практические кейсы.

Презентацию можно посмотреть тут, а запись выступления скоро появится по ссылке в VK.
В эти выходные хор «Юность» Ансамбля песни и пляски имени В.С. Локтева вместе с народной артисткой России Ларисой Долиной исполнил Гимн страны на Большой спортивной арене «Лужники» перед суперфиналом Кубка России по футболу.

Особая гордость — моя дочка Настя: она стоит в третьем ряду рядом с Ларисой Долиной.

https://www.tgoop.com/dvorec_pionerov/6480
Группа Влада Куренкова в AIRI сегодня представила Vintix — SOTA action-модель для роботов и индустриальных процессов, умеющую имитировать ход обучения с подкреплением.

Благодаря сжатию данных — состояние-действие-награда в один токен — модель анализирует в 3 раза больше информации по сравнению с аналогами: JAT от HugginFace и GATO от Google DeepMind. При этом архитектура устойчива к шуму и частичной наблюдаемости среды — Vintix успешно справляется с задержками и неполными данными, что критически важно для промышленного применения.

Главные ссылки: статья, GitHub и Forbes.
Сегодня выступал на МТС True Tech Day с лекцией о мультиагентности и ризонинге LLM. В кулуарах пообщался с ребятами из @data_secrets

Кратко рассказал о том, что может стать альтернативой трансформерных архитектур. Посмотреть видео можно по ссылке.

На мероприятии было много людей, получилось масштабно
8 июня 2025 года исполнилось 100 лет со дня рожденья Гурия Ивановича Марчука — последнего президента академии наук СССР, основателя и многолетнего директора ИВМ РАН, который сейчас носит его имя. Гурий Иванович умер в 2013 году (не застал реформу РАН), но до последних дней был председателем диссертационного совета, и всегда вел ученую сессию. Мои доклады про тензоры тоже всегда активно слушал и поддерживал.

Мне очень нравится история про то, как он занялся мат. моделированием в иммунологии, чтобы вылечить себя от сенной лихорадки. Модель показала, что нужен «шок», чтобы выйти из режима хронического заболевания, и он сам заразил себя под расписку какой-то сложной болезнью. Иммунный ответ вынес и эту болезнь, и лихорадку.

Многое из того, что делал Гурий Иванович, актуально и сейчас: например, модель климата, которая развивается до сих пор, начинала создаваться под его научным руководством. В исследованиях его отличала междисциплинарность (что сейчас хотят, но почти никто не умеет), а еще он был прекрасным организатором науки.

Завтра и послезавтра в Москве в рамках 100-летия со дня рождения пройдут праздничные мероприятия. По ссылке можно посмотреть подробную программу, а в канале — следить за новостями.
Forwarded from Complete AI
⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning

Архитектура представляет собой мультимодальную LLM, которая на вход может принимать облака точек, изображения и текст, а на выходе генерировать код операций, восстанавливающих некоторый CAD объект (например, какую-то инженерную деталь). То есть мы одновременно решаем задачу понимания сложных модальностей и задачу синтеза последовательности операций, необходимых для её восстановления по фото и облаку точек.

В дополнение добавили несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволило значительно улучшить метрики и выбить SoTA на самых известных бенчмарках по восстановлению CAD моделей: DeepCAD, Fusion360 и CC3D💪

📍Статья — https://arxiv.org/abs/2505.22914
📍GitHub
📍
Hugging Face
📍
На Papers With Code уверенная SoTA на DeepCAD бенчмарке

Буду очень рад обратной связи и предложениям по развитию, тестированию и будущему внедрению!

P.S. На прошедшем 30 мая DataFest’е в Сбере я рассказал подробно про наши исследования в области генеративного проектирования и кратко о модели, что вызвало большой интерес у представителей промышленности. Поэтому если вы ещё не слышали про cadrille, то обязательно расскажите своему другу - инженеру, ему особенно понравится😉

@complete_ai
Опубликовали статью "Confidence Is All You Need" о способности языковых моделей выполнять роль функции наград (применяются в обучении с подкреплением — DeepSeek R1 яркий тому пример) для самостоятельного улучшения качества генерации текста на основе внутренней уверенности в своих ответах.

В этой работе получилась интересная (хоть и простая) математика, и потенциально такая работа может дать возможность улучшать качество моделей даже без награды.

Апвоутнуть можно тут.
2025/06/13 10:01:57
Back to Top
HTML Embed Code: