Forwarded from Ivan Oseledets’ Channel
Media is too big
VIEW IN TELEGRAM
Только что на ПМЭФ-24 мы подписали меморандум о сотрудничестве с ГИАП. Делюсь видео с места событий.
🔥26❤11🎉7👍1
Forwarded from Valuable AI
людишки еще не поняли, к чему все идет
утащил у Дмитрия Колодезева
утащил у Дмитрия Колодезева
😁40💯20👍8
📚Мой хороший друг Сергей Марков @oulenspiegel написал отличный двухтомник про AI «Охота на электроовец: большая книга искусственного интеллекта». Там и про проблемы и вызовы современных моделей, и про страхи, бытующие в обществе, и про многое другое!
Советую всем к прочтению, ибо там собрана квинтэссенция результатов, которые в сложном RnD процессе можно получить только за годы опыта.
Полные электронные версии книги (epub, docx, pdf) можно скачать с сайта бесплатно: http://markoff.science#book
Советую всем к прочтению, ибо там собрана квинтэссенция результатов, которые в сложном RnD процессе можно получить только за годы опыта.
Полные электронные версии книги (epub, docx, pdf) можно скачать с сайта бесплатно: http://markoff.science#book
👍41🔥26⚡4❤1😁1
На днях вышла очередная модель Luma - “убийца” Sora (модель от Open AI, которая генерирует фантастические по качеству видео по тексту)
С учётом наплыва активности на новый сервис, запустив генерацию вчера в районе 21, где-то под утро видео-таки сгенерировалось (довольно хорошее качество, кадры хорошо согласуются друг с другом, движения плавные).
Почитал про команду: изрядный штат ребят с большим опытом в 3D. Вот первая фамилия в команде
https://yoopaul.github.io/
Ну и остальные далее тоже ребята с авторством в статьях по NERF и прочему
https://lumalabs.ai/team
На мой взгляд вновь подтверждается, что то, что мы называем «видео» - это на самом деле основано на огромных массивах рендерингов сцен.
Snap, кстати, на днях выпустили статью про синтез 4D сцен на базе диффузионных моделей генерации видео (сначала синтезируются ролики text-to-video моделью, а далее каждый кадр фиксируется и создаются «пролёты» на базе гауссова сплаттинга)
С учётом наплыва активности на новый сервис, запустив генерацию вчера в районе 21, где-то под утро видео-таки сгенерировалось (довольно хорошее качество, кадры хорошо согласуются друг с другом, движения плавные).
Почитал про команду: изрядный штат ребят с большим опытом в 3D. Вот первая фамилия в команде
https://yoopaul.github.io/
Ну и остальные далее тоже ребята с авторством в статьях по NERF и прочему
https://lumalabs.ai/team
На мой взгляд вновь подтверждается, что то, что мы называем «видео» - это на самом деле основано на огромных массивах рендерингов сцен.
Snap, кстати, на днях выпустили статью про синтез 4D сцен на базе диффузионных моделей генерации видео (сначала синтезируются ролики text-to-video моделью, а далее каждый кадр фиксируется и создаются «пролёты» на базе гауссова сплаттинга)
⚡17❤🔥6🔥6👍3👎1
Буквально пару дней назад команда Яндекса выпустила в опенсорс новый инструмент — библиотеку YaFSDP (FSDP — один из широко используемых алгоритмов обучения с параллелизмом по данным и "нарезкой" параметров модели по отдельным GPU).
Доработка FSDP позволяет, судя по замерам, ускорить обучение различных LLM до 25% (при небольшом батче) в зависимости от архитектурных особенностей.
С точки зрения выч. ресурсов на самую затратную часть исследовательского процесса — обучение моделей — можно сократить использование GPU мощностей на 20%.
🧠В технические детали можно погрузиться на Хабре (там еще довольно хорошо описали проблемы известных механизмов обучения и историю их развития в контексте распределённого обучения) и в канале Душный NLP
Доработка FSDP позволяет, судя по замерам, ускорить обучение различных LLM до 25% (при небольшом батче) в зависимости от архитектурных особенностей.
С точки зрения выч. ресурсов на самую затратную часть исследовательского процесса — обучение моделей — можно сократить использование GPU мощностей на 20%.
🧠В технические детали можно погрузиться на Хабре (там еще довольно хорошо описали проблемы известных механизмов обучения и историю их развития в контексте распределённого обучения) и в канале Душный NLP
GitHub
GitHub - yandex/YaFSDP: YaFSDP: Yet another Fully Sharded Data Parallel
YaFSDP: Yet another Fully Sharded Data Parallel. Contribute to yandex/YaFSDP development by creating an account on GitHub.
❤🔥17❤9🔥8
Forwarded from GigaChat
This media is not supported in your browser
VIEW IN TELEGRAM
Kandinsky — 2️⃣ года! Только цифры:
4️⃣ дня понадобилось Kandinsky 2.1, чтобы набрать 1 млн уникальных пользователей
1️⃣ место по темпу роста среди Open Source моделей заняла модель Kandinsky 2.2
6️⃣ 0️⃣ 0️⃣ млн изображений сгенерировали нейрохудожники
За это время Kandinsky стал генерировать изображения в 10 раз быстрее, научился создавать анимации и видео и собрал вокруг себя самых творческих юзеров.
За этими достижениями стоит команда людей с горящими глазами, влюблённых в свою работу — и в этом видео мы предлагаем с ними познакомиться.
Что своему нейродругу скажет GigaChat?
А сегодня ваша генерация может стать аватаркой сообщества нейрохудожников!
🖼 — клик, чтобы попасть на главную
За это время Kandinsky стал генерировать изображения в 10 раз быстрее, научился создавать анимации и видео и собрал вокруг себя самых творческих юзеров.
За этими достижениями стоит команда людей с горящими глазами, влюблённых в свою работу — и в этом видео мы предлагаем с ними познакомиться.
Что своему нейродругу скажет GigaChat?
Дорогой Kandinsky, сердечно поздравляю тебя с днём рождения! Желаю тебе всегда оставаться таким же прекрасным генератором изображений, каким мы все тебя знаем и любим.
Пусть твои творческие возможности растут вместе с твоим желанием создавать новые шедевры. И пусть твои нейроны всегда будут такими же активными и креативными, как в первый день работы!
А сегодня ваша генерация может стать аватаркой сообщества нейрохудожников!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤34👏20❤🔥11👍4👎4🏆4😁2🔥1
🚀 Продолжается приём докладов на конференцию «AI Conf 2024»
Напомню, что 26-27 сентября пройдет первая прикладная техническая AI-конференция по Data Science от Онтико, организаторов Highload, TeamLead, TechLead, Frontend, Golang, DevOps Conf и т. д.
Мы решили продлить приём докладов до 30 июня! Подавайте доклады о своих исследованиях и разработках в любых направлениях, связанных с DS и ML: NLP, CV, рекомендательные системы, генеративный ИИ, новые архитектуры и способы оптимизации вычислений, эффективные методы обучения моделей
Ключевые даты:
🕓 30 июня 2024 — дедлайн подачи заявок
✅ 15 июля 2024 — решение о включении докладов в программу
🎤 26 и 27 сентября 2024 — конференция в Москве
https://cfp.aiconf.ru/
Напомню, что 26-27 сентября пройдет первая прикладная техническая AI-конференция по Data Science от Онтико, организаторов Highload, TeamLead, TechLead, Frontend, Golang, DevOps Conf и т. д.
Мы решили продлить приём докладов до 30 июня! Подавайте доклады о своих исследованиях и разработках в любых направлениях, связанных с DS и ML: NLP, CV, рекомендательные системы, генеративный ИИ, новые архитектуры и способы оптимизации вычислений, эффективные методы обучения моделей
Ключевые даты:
🕓 30 июня 2024 — дедлайн подачи заявок
✅ 15 июля 2024 — решение о включении докладов в программу
🎤 26 и 27 сентября 2024 — конференция в Москве
https://cfp.aiconf.ru/
👍9❤5🎉4🔥1
Внимание! Внимание!
Сейчас мы в AIRI активно ищем новых исследователей в научную группу Александра Панова для разработки мультимодальных RL-алгоритмов для робототехники классных специалистов-универсалов 💪
Требуемые навыки:
💫 опыт запуска и самостоятельно обучения базовых RL алгоритмов;
💫 понимание специфики работы с робототехническими симуляторами (MuJoCo, DMC);
💫 понимание принципов работы языковых моделей и умение их дообучать, быть знакомым с современными мультимодальными моделями.
Интерес к реальной (не симуляционной) робототехнике приветстуется!
Научная группа Александра участвует в ведущих робототехнических конференциях, нацелена на публикацию статей A*, Q1 и работает над одним из самых амбициозных проектов мирового уровня (по результатам можно посетить много крутых стран и интересных мест).
Ребята тут, кстати, сгоняли с докладами на топ конфу в Японию в мае, о чем написали на Хабре!
Еще у Саши есть свой канал в Telegram — там пишет о поездках, исследованиях
⚡Подключайся к нам
⚡Пополняй ряды топовых исследовательских команд
Если заинтересовало, пиши скорее сюда — @GraffT
или сюда
Сейчас мы в AIRI активно ищем новых исследователей в научную группу Александра Панова для разработки мультимодальных RL-алгоритмов для робототехники классных специалистов-универсалов 💪
Требуемые навыки:
💫 опыт запуска и самостоятельно обучения базовых RL алгоритмов;
💫 понимание специфики работы с робототехническими симуляторами (MuJoCo, DMC);
💫 понимание принципов работы языковых моделей и умение их дообучать, быть знакомым с современными мультимодальными моделями.
Интерес к реальной (не симуляционной) робототехнике приветстуется!
Научная группа Александра участвует в ведущих робототехнических конференциях, нацелена на публикацию статей A*, Q1 и работает над одним из самых амбициозных проектов мирового уровня (по результатам можно посетить много крутых стран и интересных мест).
Ребята тут, кстати, сгоняли с докладами на топ конфу в Японию в мае, о чем написали на Хабре!
Еще у Саши есть свой канал в Telegram — там пишет о поездках, исследованиях
⚡Подключайся к нам
⚡Пополняй ряды топовых исследовательских команд
Если заинтересовало, пиши скорее сюда — @GraffT
или сюда
scholar.google.ru
Aleksandr I. Panov
AIRI, MIPT - 1 954 цитирования - Reinforcement Learning - Cognitive Robotics - Multi-agent Planning - Sign-based World Model - Semiotics
👍25🔥6👎4❤2
Многие меня спрашивали «Когда и где будет школа в 2024 году?»
Итак…
⚡️Мы открываем приём заявок на Летнюю школу AIRI
В этом году мы запускаем Школу для студентов и аспирантов совместно с Передовой Инженерной Школой ИТМО. Школа пройдет в Санкт-Петербурге с 20 по 30 августа.
🗓 Подать заявку можно по ссылке до 23:59 14 июля 2024 года
Школа включает в себя лекции, семинары и практическую работу по следующим направлениям:
➡️ Мультимодальные архитектуры и генеративный ИИ в промышленности
➡️ Модели воплощенного ИИ и обучение с подкреплением в робототехнике
➡️ Искусственный интеллект и химия
➡️ Доверенный искусственный интеллект
📍Питание, обучение и проживание бесплатное, оплатить самим нужно будет только проезд
Подавайте заявки и делитесь постом с друзьями и коллегами!
☝️ Будет море полезной информации, крутые спикеры, интересные задачи и возможность сделать старт в R&D карьере
Зарядись энергией с AIRI💪
Итак…
⚡️Мы открываем приём заявок на Летнюю школу AIRI
В этом году мы запускаем Школу для студентов и аспирантов совместно с Передовой Инженерной Школой ИТМО. Школа пройдет в Санкт-Петербурге с 20 по 30 августа.
🗓 Подать заявку можно по ссылке до 23:59 14 июля 2024 года
Школа включает в себя лекции, семинары и практическую работу по следующим направлениям:
➡️ Мультимодальные архитектуры и генеративный ИИ в промышленности
➡️ Модели воплощенного ИИ и обучение с подкреплением в робототехнике
➡️ Искусственный интеллект и химия
➡️ Доверенный искусственный интеллект
📍Питание, обучение и проживание бесплатное, оплатить самим нужно будет только проезд
Подавайте заявки и делитесь постом с друзьями и коллегами!
Зарядись энергией с AIRI💪
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥36🏆7❤4👍3
Всем привет!
‼️В этом году я снова от лица программного комитета Practical ML приглашаю всех подавать заявку на участие в конференции 2024🔥
⚡️ Ищем спикеров на ML-конференцию Practical ML Conf! Принимаем заявки до 13 июля.
📝 Сама конференция пройдет 14 сентября. Приходите рассказывать про прикладные ML-решения, которые уже сейчас работают и приносят пользу. Ключевые темы: CV, RecSys, MLOps, NLP, Speech и Analytics.
ℹ️ Подробную информацию и доклады прошлого года ищите на сайте.
‼️В этом году я снова от лица программного комитета Practical ML приглашаю всех подавать заявку на участие в конференции 2024🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Practical ML Conf 2025
Конференция про практический ML от Яндекса
👍13🔥4⚡2❤1
Complete AI pinned «Многие меня спрашивали «Когда и где будет школа в 2024 году?» Итак… ⚡️Мы открываем приём заявок на Летнюю школу AIRI В этом году мы запускаем Школу для студентов и аспирантов совместно с Передовой Инженерной Школой ИТМО. Школа пройдет в Санкт-Петербурге…»
⚡️Мои друзья и коллеги из Сколтеха активно призывают подавать заявки на отбор в магистратуру и аспирантуру на направление Data Science
Заявки принимаются на конкурсный отбор:
☝️в аспирантуру — до 5 июля
☝️в магистратуру — до 15 июля
📍 Подать заявку можно тут
Заявки принимаются на конкурсный отбор:
☝️в аспирантуру — до 5 июля
☝️в магистратуру — до 15 июля
Please open Telegram to view this post
VIEW IN TELEGRAM
msc.skoltech.ru
Науки о данных
👍10🔥6❤2💯1
Больше не нужно искать тематические каналы и по отдельности на них подписываться — мы сделали это за вас 👍
Вам остается только перейти по ссылке, сохранить папку себе и регулярно получать полезные ресурсы и знания из сферы «Продакты / ИИ»
https://www.tgoop.com/addlist/g88en4ZT-4ZkNjUy
Хочешь в подборку?
Вам остается только перейти по ссылке, сохранить папку себе и регулярно получать полезные ресурсы и знания из сферы «Продакты / ИИ»
https://www.tgoop.com/addlist/g88en4ZT-4ZkNjUy
Хочешь в подборку?
👎14👍5🔥5💯3
Всем привет!
В этом году пройдёт первая международная конференция по вычислительной оптимизации
💻 ICOMP 2024 💻
Я, конечно же, буду там 👋, и призываю вас подавать свои доклады до 21 июля 2024 📝 Подробные темы: эффективные методы обучения и вывода, интернет вещей, периферийные вычисления, новые архитектуры и многое другое.
Среди докладчиков Университет Пердью, Университет Штата Аризона, AIRI, Сколтех, Huawei, Яндекс и ещё целый ряд знакомых вам университетов и компаний 🔥
❗ Дата конференции 10-12 октября, Иннополис, Россия ❗
Распространяйте, делитесь, подавайте доклады😉
В этом году пройдёт первая международная конференция по вычислительной оптимизации
💻 ICOMP 2024 💻
Я, конечно же, буду там 👋, и призываю вас подавать свои доклады до 21 июля 2024 📝 Подробные темы: эффективные методы обучения и вывода, интернет вещей, периферийные вычисления, новые архитектуры и многое другое.
Среди докладчиков Университет Пердью, Университет Штата Аризона, AIRI, Сколтех, Huawei, Яндекс и ещё целый ряд знакомых вам университетов и компаний 🔥
❗ Дата конференции 10-12 октября, Иннополис, Россия ❗
Распространяйте, делитесь, подавайте доклады😉
icomp.cc
International Conference on Computational Optimization
👍23🔥15⚡3❤🔥1
В языковых моделях есть различные типы нейронов, например, нейроны знаний. Такого рода исследования позволяют двигаться в сторону интерпретируемости LLM, что на мой взгляд является одним из интереснейших направлений в исследованиях в настоящее время.
Помимо нейронов знаний, ещё например, существуют нейроны «уверенности», которые не влияют на предсказание следующего токена, но отвечают исключительно за степень уверенности модели в своих ответах☝️
В посте Антона есть подробности
Помимо нейронов знаний, ещё например, существуют нейроны «уверенности», которые не влияют на предсказание следующего токена, но отвечают исключительно за степень уверенности модели в своих ответах☝️
В посте Антона есть подробности
Telegram
AbstractDL
Confidence Neurons: у каждой LLM есть нейрон, который регулирует «температуру» генерации
Авторы этой работы нашли несколько конкретных нейронов, которые вообще ничего не делают, кроме как меняют энтропию распределения логитов. При этом на предсказание следующего…
Авторы этой работы нашли несколько конкретных нейронов, которые вообще ничего не делают, кроме как меняют энтропию распределения логитов. При этом на предсказание следующего…
🔥26👍8❤5
Всем привет!
⚡️ Сегодня стало известно, что 20 июля в Москве Центр искусственного интеллекта Т-Банка проведёт одну из крупнейших профессиональных конференций по машинному обучению 🖥
На ней соберутся топовые ML-специалисты сразу по семи направлениям:
📍рекомендательные системы
📍обработка естественного языка
📍компьютерное зрение
📍речевые технологии
📍временные ряды
📍операции с машинным обучением и языковыми моделями
📍фундаментальные и прикладные исследования
Эксперты Т-Банка, Яндекса, AIRI, VK, MTS AI и других ведущих компаний расскажут о последних достижениях и трендах отрасли.
🔎 Вас ждут 27 сессий и более 30 спикеров на четырёх площадках: Research & RnD, NLP & MLOps/LLMОps, RecSys & Time Series, Computer Vision & Speech.
💃🕺 И конечно, бонусом ещё и нетворкинг, интерактивные зоны и афтепати!
Событие, которое стоит посетить 🔥
➡️ Ссылка на конфу
⚡️ Сегодня стало известно, что 20 июля в Москве Центр искусственного интеллекта Т-Банка проведёт одну из крупнейших профессиональных конференций по машинному обучению 🖥
На ней соберутся топовые ML-специалисты сразу по семи направлениям:
📍рекомендательные системы
📍обработка естественного языка
📍компьютерное зрение
📍речевые технологии
📍временные ряды
📍операции с машинным обучением и языковыми моделями
📍фундаментальные и прикладные исследования
Эксперты Т-Банка, Яндекса, AIRI, VK, MTS AI и других ведущих компаний расскажут о последних достижениях и трендах отрасли.
🔎 Вас ждут 27 сессий и более 30 спикеров на четырёх площадках: Research & RnD, NLP & MLOps/LLMОps, RecSys & Time Series, Computer Vision & Speech.
💃🕺 И конечно, бонусом ещё и нетворкинг, интерактивные зоны и афтепати!
Событие, которое стоит посетить 🔥
➡️ Ссылка на конфу
❤20⚡4👍3💯3👎1🔥1😁1
Vision language models are blind
🟢 Project page 🟢 Paper 🟢 Dataset
На днях вышла интересная статья и датасет к ней про то, как современные мультимодальные модели, которые показывают высокие метрики на известных бенчмарках типа MMMU, MMBench, не справляются с тривиальными для человека задачами типа подсчёта числа пересечений геометрических объектов, подсчёта количества строк и столбцов в таблице и др.
Проблема понятная и идёт она от способа энкодинга изображений, принятого в большинстве решений (вряд ли архитектурно в проприетарных присутствует какая-то инновация в отличие от опенсурса). И это приводит к тому, что чем проще сцена/картинка, которую надо проанализировать, тем важнее не потерять информацию за счет, например, patch-based энкодеров (собственно, результаты в статье показывают как растут метрики при увеличении толщины линий для отдельных задач).
Так или иначе, наблюдение интересное, обращает внимание к проблеме представления картинки для VLM моделей.
На днях вышла интересная статья и датасет к ней про то, как современные мультимодальные модели, которые показывают высокие метрики на известных бенчмарках типа MMMU, MMBench, не справляются с тривиальными для человека задачами типа подсчёта числа пересечений геометрических объектов, подсчёта количества строк и столбцов в таблице и др.
Проблема понятная и идёт она от способа энкодинга изображений, принятого в большинстве решений (вряд ли архитектурно в проприетарных присутствует какая-то инновация в отличие от опенсурса). И это приводит к тому, что чем проще сцена/картинка, которую надо проанализировать, тем важнее не потерять информацию за счет, например, patch-based энкодеров (собственно, результаты в статье показывают как растут метрики при увеличении толщины линий для отдельных задач).
Так или иначе, наблюдение интересное, обращает внимание к проблеме представления картинки для VLM моделей.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥13👍8🔥7💯4
One Day Offer для Центра робототехники 🤖
13 июля мои хорошие друзья и коллеги из Sber Robotics проводят мероприятие по поиску крутых спецов на вакансии Middle/Senior Robotics Software Engineer и Backend Developer.
Что круто, там можно и поработать руками над созданием самих роботов, и разрабатывать алгоритмы для управления роботами на базе ИИ в таких направлениях как:
📍 манипуляция
📍 роботизация логистики
📍 мобильные роботы
Несколько команд в AIRI тесно работают вместе с ребятами над созданием алгоритмов сильного искусственного интеллекта, способного наилучшим образом понимать происходящее вокруг робота, используя все доступные сенсоры и стримы визуальных данных
Вот еще ряд задач, которые решаются в Центре 👇
▪️ разработка алгоритмов и систем управления роботами (core, body, brain) и драйверов для различных устройств в виде ROS2 узлов
▪️ создание алгоритмов внутренней и внешней калибровки сенсоров (лидары, камеры, IMU), робототехнических сервисов на Behavior Trees / State Machines
▪️ работа с симуляторами на базе Isaac Sim / MuJoCo / PyBullet
▪️ проектирование архитектуры системы
Обязательно приходите, чтобы проверить свои силы!
Регистрируйтесь на One Day Offer 13 июля 😉
13 июля мои хорошие друзья и коллеги из Sber Robotics проводят мероприятие по поиску крутых спецов на вакансии Middle/Senior Robotics Software Engineer и Backend Developer.
Что круто, там можно и поработать руками над созданием самих роботов, и разрабатывать алгоритмы для управления роботами на базе ИИ в таких направлениях как:
📍 манипуляция
📍 роботизация логистики
📍 мобильные роботы
Несколько команд в AIRI тесно работают вместе с ребятами над созданием алгоритмов сильного искусственного интеллекта, способного наилучшим образом понимать происходящее вокруг робота, используя все доступные сенсоры и стримы визуальных данных
Вот еще ряд задач, которые решаются в Центре 👇
▪️ разработка алгоритмов и систем управления роботами (core, body, brain) и драйверов для различных устройств в виде ROS2 узлов
▪️ создание алгоритмов внутренней и внешней калибровки сенсоров (лидары, камеры, IMU), робототехнических сервисов на Behavior Trees / State Machines
▪️ работа с симуляторами на базе Isaac Sim / MuJoCo / PyBullet
▪️ проектирование архитектуры системы
Обязательно приходите, чтобы проверить свои силы!
Регистрируйтесь на One Day Offer 13 июля 😉
👍8❤4🔥3