Forwarded from GigaChat
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from ИИ Песочница | RnD про ML, AI, Data Science
В мире, где персонализация решает всё — от любимых фильмов до идеальных покупок — рекомендательные системы стали must-have инструментом. Хотите не просто понимать их, а создавать с нуля? Тогда этот курс для вас!
Sber AI Lab представляет курс по рекомендательным системам и open-source библиотеке RePlay!
🎁 Бонус: Сертификат от СберУниверситета для участников, кто успешно закроет все модули - для резюме и личной гордости
Зачем это вам?
Рынок рекомендательных систем растёт на 24,7% в год (Research Nester), и спрос на специалистов огромен. С этим курсом вы войдёте в топ востребованных профессионалов!
#курс
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from RnD CV Team
Всем привет!
Мы выпустили новую статью — HandReader: набор архитектур для распознавания дактиля (англ. fingerspelling) 🚀 Это последовательный показа дактилем (букв из жестовой азбуки), который применяется в основном для слов, являющихся именами собственными.
В работе мы предлагаем универсальные решения для трёх модальностей:
- на основе RGB-кадров,
- на основе ключевых точек,
- и на их сочетании (multi-modal).
Все три варианта архитектур достигают SOTA-результатов на датасетах ChicagoFSWild и ChicagoFSWild+.
А ещё, поскольку до сих пор не существовало открытых данных по русскому дактилю, мы собрали и выкладываем первый в мире датасет — Znaki, содержаший более 1593 размеченных фраз и более 37 тыс. HD+ видео, который был собран глухими и слабослышащими людьми.
Почитать здесь:
📝 HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля
📖 HandReader: Advanced Techniques for Efficient Fingerspelling Recognition
Мы выпустили новую статью — HandReader: набор архитектур для распознавания дактиля (англ. fingerspelling) 🚀 Это последовательный показа дактилем (букв из жестовой азбуки), который применяется в основном для слов, являющихся именами собственными.
В работе мы предлагаем универсальные решения для трёх модальностей:
- на основе RGB-кадров,
- на основе ключевых точек,
- и на их сочетании (multi-modal).
Все три варианта архитектур достигают SOTA-результатов на датасетах ChicagoFSWild и ChicagoFSWild+.
А ещё, поскольку до сих пор не существовало открытых данных по русскому дактилю, мы собрали и выкладываем первый в мире датасет — Znaki, содержаший более 1593 размеченных фраз и более 37 тыс. HD+ видео, который был собран глухими и слабослышащими людьми.
Почитать здесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from GigaChat
Please open Telegram to view this post
VIEW IN TELEGRAM
Ииии победителем в номинации...
...самая всратая история в моей жизни становится мое посещение премии Generation Awards. История немного выбила меня из колеи, возвращаюсь в нее, наворачивая по Питеру 21ую тысячу шагов... У нас с Питером какая-то взаимная нелюбовь...
Мудрость дня, которую я хорошо усвоила: если в туалете висит табличка "Need help? Тогда звоните НОМЕР" - задумайтесь перед тем как запирать дверь, она здесь не просто так...
...самая всратая история в моей жизни становится мое посещение премии Generation Awards. История немного выбила меня из колеи, возвращаюсь в нее, наворачивая по Питеру 21ую тысячу шагов... У нас с Питером какая-то взаимная нелюбовь...
Мудрость дня, которую я хорошо усвоила: если в туалете висит табличка "Need help? Тогда звоните НОМЕР" - задумайтесь перед тем как запирать дверь, она здесь не просто так...
🐾По следам вебинара Технологии продвинутого Data Science: что под капотом?
На вебинаре в OTUS рассказала, про продвинутые методы ML, которые мы проходим на ML.Advanced в Otus. Обсудили, что под капотом у моделей для временных рядов и рекомендательных систем, на каких принципах основан современный RL, в чем мощь Байесовских методов и какие фреймворки можно использовать для AutoML.
👀Запись
✍ Слайды
@mashkka_ds
#открытыйурок
На вебинаре в OTUS рассказала, про продвинутые методы ML, которые мы проходим на ML.Advanced в Otus. Обсудили, что под капотом у моделей для временных рядов и рекомендательных систем, на каких принципах основан современный RL, в чем мощь Байесовских методов и какие фреймворки можно использовать для AutoML.
👀Запись
@mashkka_ds
#открытыйурок
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆Финалист Generation Awards - для меня эта уже победа
Спасибо всем, кто поддержал меня вчера. Было Так невероятно приятно получить от вас столько теплых слов.
Многие ошибочно решили, что меня расстроил результат, но НЕТ! Для меня выйти в финал - это уже победа и я искренне горжусь тем, что вышла в топ.
Спасибо организаторам, что позвали участвовать - очень ценный и полезный опыт для меня, а @yacka_nata за помощь с монтажом.
А вот Питер в очередной раз преподнес мне всратую свинью. Что же случилось? Рассказываю в инсте и на YouTube (warning: много эмоций и немножко мат).
Спасибо всем, кто поддержал меня вчера. Было Так невероятно приятно получить от вас столько теплых слов.
Многие ошибочно решили, что меня расстроил результат, но НЕТ! Для меня выйти в финал - это уже победа и я искренне горжусь тем, что вышла в топ.
Спасибо организаторам, что позвали участвовать - очень ценный и полезный опыт для меня, а @yacka_nata за помощь с монтажом.
А вот Питер в очередной раз преподнес мне всратую свинью. Что же случилось? Рассказываю в инсте и на YouTube (warning: много эмоций и немножко мат).
🗣Выступила на Conversations с рассказом про бенчмарки и LLM
Вчера выступила на Conversations с докладом про оценку LLM: рассказала про вызовы в оценке современных больших языковых моделей и про наши бенчмарки для русского языка. И так приятно, что даже на выступление собрался полный зал, а в кулуарах потом услышала много благодарностей про доклад.
Хорошо, что конференция проходит не в самом Питере, который просто не принимает меня от слова совсем. => доклад прошел как по маслу, а я получила невероятный эмоциональный заряд.
👀Слайды
@mashkka
#трудовыебудни
#llm
Вчера выступила на Conversations с докладом про оценку LLM: рассказала про вызовы в оценке современных больших языковых моделей и про наши бенчмарки для русского языка. И так приятно, что даже на выступление собрался полный зал, а в кулуарах потом услышала много благодарностей про доклад.
Хорошо, что конференция проходит не в самом Питере, который просто не принимает меня от слова совсем. => доклад прошел как по маслу, а я получила невероятный эмоциональный заряд.
👀Слайды
@mashkka
#трудовыебудни
#llm
Media is too big
VIEW IN TELEGRAM
#justaboutme NAACL'25 vlog
Cегодня в личнорубрике вспоминаю лучшие моменты поездки на NAACL'25 в апреле. Вспоминаем лучшее за 30 секунд.
❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.
#mashkka_usa
Cегодня в личнорубрике вспоминаю лучшие моменты поездки на NAACL'25 в апреле. Вспоминаем лучшее за 30 секунд.
❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.
#mashkka_usa
#mashkka_reading Подельник начинается в субботу📚
Перечитала любимую классику братьев Стругацких "Понедельник начинается в субботу" - книгу, которая с детства входит в мой топ.
Если вдруг кто-то не читал сей шедевр, кратко напомню сюжет, молодой программист Александр Привалов случайно попадает в загадочный НИИЧАВО (Научно-исследовательский институт Чародейства и Волшебства). Здесь он становится частью невероятного мира, где магия и наука переплетаются в одну странную, но удивительно логичную картину. В этом институте работают настоящие энтузиасты: они изучают бессмертие, воскрешают древних существ и даже пытаются понять, почему человеческие желания такие сложные.
В этой книге замечательно просто все: стремительный и непредсказуемый сюжет, вселенная НИИ, фактурные персонажи, но главное это непревзойденный юмор, по-доброму смеющийся над работой институтов и так точно пародирующий атмосферу в них. Так шутить умеют только братья Стругацкие, и больше никто!
✔️12-я книга за 2025
#mashkka_reading #книжнаяполка #книга #book
Перечитала любимую классику братьев Стругацких "Понедельник начинается в субботу" - книгу, которая с детства входит в мой топ.
Если вдруг кто-то не читал сей шедевр, кратко напомню сюжет, молодой программист Александр Привалов случайно попадает в загадочный НИИЧАВО (Научно-исследовательский институт Чародейства и Волшебства). Здесь он становится частью невероятного мира, где магия и наука переплетаются в одну странную, но удивительно логичную картину. В этом институте работают настоящие энтузиасты: они изучают бессмертие, воскрешают древних существ и даже пытаются понять, почему человеческие желания такие сложные.
В этой книге замечательно просто все: стремительный и непредсказуемый сюжет, вселенная НИИ, фактурные персонажи, но главное это непревзойденный юмор, по-доброму смеющийся над работой институтов и так точно пародирующий атмосферу в них. Так шутить умеют только братья Стругацкие, и больше никто!
✔️12-я книга за 2025
#mashkka_reading #книжнаяполка #книга #book
Forwarded from GigaChat
POLLUX: бенчмарк для оценки творческих способностей AI 🤖
Обычные бенчмарки типа MMLU — это ЕГЭ для нейросетей: выбери правильный ответ из списка. В реальном применении мы используем AI для написания текстов, генерации идей и переводов
POLLUX — первый экспертный бенчмарк для оценки генеративных способностей на русском от специалистов Сбера:
➡️ 2 100 уникальных заданий (написаны экспертами с нуля)
➡️ 152 типа задач — от художественных текстов до анализа кода
➡️ 66 критериев оценки
➡️ 471 тысяча экспертных оценок
➡️ обученные AI-судьи для автоматической оценки
Мы протестировали GPT-4o, Claude 3.5, LLaMA и другие. Оказалось, что даже топовые модели пока уступают людям в творчестве, а выбирать их нужно под конкретные задачи, а не по общему рейтингу
📌 Проект открытый — читаем про него тут
📌 Пробуем демо здесь
Обычные бенчмарки типа MMLU — это ЕГЭ для нейросетей: выбери правильный ответ из списка. В реальном применении мы используем AI для написания текстов, генерации идей и переводов
POLLUX — первый экспертный бенчмарк для оценки генеративных способностей на русском от специалистов Сбера:
Мы протестировали GPT-4o, Claude 3.5, LLaMA и другие. Оказалось, что даже топовые модели пока уступают людям в творчестве, а выбирать их нужно под конкретные задачи, а не по общему рейтингу
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Kali Novskaya
🌸Deep Research Agents: обзор 🌸
#nlp #про_nlp #nlp_papers
Вышла неплохая обзорная статья про пересечение Deep Research и агентов — Deep Research Agents: A Systematic Examination And Roadmap.
Авторы определяют Deep Research агентов как AI-агенты на базе LLM, объединяющие динамически адаптивные рассуждения, способность к планированию, многошаговый внешний поиск и извлечение знаний и использование инструментов (tools, function calling), а также генерацию комплексных аналитических отчетов для информационно-исследовательских задач.
Приводится подробный анализ работ по теме
— Chain-of-thought, Reasoning
— Tool use, MCP
— Планирование в LLM
— GPRO, PPO, Reinforce++ и как их готовить
Отдельно способность к Deep Research сравнивают на примере бенчмарка GAIA (на нем оцениваются практически все работы).
Открытые вопросы и задачи, которые стоят перед исследователями в 2025:
— Расширение источников информации — когда информации хватит для отчета? Когда и где искать, когда ее недостаточно?
— Fact Checking и информация, меняющаяся во времени
— Асинхронность в выполнении задач и этапов плана у агентов
— Адекватная интеграция reasoning и вывода из внешних тулзов
— Мультиагентные архитектуры и автономное развитие систем с онлайн-RL
Нашу статью MLGym процитировали, опять же!🥹
🟣 Статья
🟣 GitHub
#nlp #про_nlp #nlp_papers
Вышла неплохая обзорная статья про пересечение Deep Research и агентов — Deep Research Agents: A Systematic Examination And Roadmap.
Авторы определяют Deep Research агентов как AI-агенты на базе LLM, объединяющие динамически адаптивные рассуждения, способность к планированию, многошаговый внешний поиск и извлечение знаний и использование инструментов (tools, function calling), а также генерацию комплексных аналитических отчетов для информационно-исследовательских задач.
Приводится подробный анализ работ по теме
— Chain-of-thought, Reasoning
— Tool use, MCP
— Планирование в LLM
— GPRO, PPO, Reinforce++ и как их готовить
Отдельно способность к Deep Research сравнивают на примере бенчмарка GAIA (на нем оцениваются практически все работы).
Открытые вопросы и задачи, которые стоят перед исследователями в 2025:
— Расширение источников информации — когда информации хватит для отчета? Когда и где искать, когда ее недостаточно?
— Fact Checking и информация, меняющаяся во времени
— Асинхронность в выполнении задач и этапов плана у агентов
— Адекватная интеграция reasoning и вывода из внешних тулзов
— Мультиагентные архитектуры и автономное развитие систем с онлайн-RL
Нашу статью MLGym процитировали, опять же!
Please open Telegram to view this post
VIEW IN TELEGRAM
#пятничныемемасы
Шла пятница и был дедлайн на System Demo EMNLP. Они держались как могли
Шла пятница и был дедлайн на System Demo EMNLP. Они держались как могли
🎓МарьИванна идет на выпускной ФКН
На этой неделе был отличный повод выбраться в ВШЭ - пришла поздравить своих магистров-выпускников на выпускной ФКН. Вела у них занятия, связанные с Data Science, а в этот день пришла сказать им напутсвенные слова и искренне порадоваться за них.
Единственная очная встреча выпускников онлайн-программ, и повод для этого прекрасен как никогда. Эти ребята могут по праву гордиться собой: cтать магистром одного из лучших факультетов страны по Data Science - невероятное достижение. И это на 200% их заслуга и результат их упорного труда. А я горжусь своими замечательными краснодипломницами: @juliawolkenstein и @planqua. Таких талантливых и целеустремленных студенток, как они сложно найти!
👏Поаплодируйте им, выпускникам ФКН и всем, кто в этом году окончил тот или иной вуз! Это важный этап в жизни каждого!
#вшэ #фкн #graduate #выпускник #hse
На этой неделе был отличный повод выбраться в ВШЭ - пришла поздравить своих магистров-выпускников на выпускной ФКН. Вела у них занятия, связанные с Data Science, а в этот день пришла сказать им напутсвенные слова и искренне порадоваться за них.
Единственная очная встреча выпускников онлайн-программ, и повод для этого прекрасен как никогда. Эти ребята могут по праву гордиться собой: cтать магистром одного из лучших факультетов страны по Data Science - невероятное достижение. И это на 200% их заслуга и результат их упорного труда. А я горжусь своими замечательными краснодипломницами: @juliawolkenstein и @planqua. Таких талантливых и целеустремленных студенток, как они сложно найти!
👏Поаплодируйте им, выпускникам ФКН и всем, кто в этом году окончил тот или иной вуз! Это важный этап в жизни каждого!
#вшэ #фкн #graduate #выпускник #hse
🐾По следам вебинара Как правильно готовить данные для ML-моделей?
На вебинаре в OTUS разобрали основные этапы разведочного анализа данных и то, как правильно "готовить данные" в Python для моделей машинного обучения.
- Что делать с пропусками?
- Как быть с выбросами?
- Зачем смотреть корреляции?
Это и многое другое обсуждаем и применяем в на практике.
👀Запись
✍ Слайды
💻Практика
@mashkka_ds
#открытыйурок
На вебинаре в OTUS разобрали основные этапы разведочного анализа данных и то, как правильно "готовить данные" в Python для моделей машинного обучения.
- Что делать с пропусками?
- Как быть с выбросами?
- Зачем смотреть корреляции?
Это и многое другое обсуждаем и применяем в на практике.
👀Запись
💻Практика
@mashkka_ds
#открытыйурок
Please open Telegram to view this post
VIEW IN TELEGRAM