Mashkka про Data Science

Forwarded from GigaChat

Please open Telegram to view this post

1.2K views10:51

Forwarded from ИИ Песочница | RnD про ML, AI, Data Science

🚀

Новый курс по рекомендательным системам и RePlay — прокачай навыки персонализации данных!

В мире, где персонализация решает всё — от любимых фильмов до идеальных покупок — рекомендательные системы стали must-have инструментом. Хотите не просто понимать их, а создавать с нуля? Тогда этот курс для вас!

Sber AI Lab представляет курс по рекомендательным системам и open-source библиотеке RePlay!

🔘 Погружение в основы: от коллаборативной фильтрации до гибридных моделей
🔘 Практика на реальных кейсах, только работающие решения
🔘 Освоение RePlay — мощного инструмента для построения рекомендаций
🔘 Гибкий график — учитесь где угодно и когда удобно

🎁 Бонус: Сертификат от СберУниверситета для участников, кто успешно закроет все модули - для резюме и личной гордости

Зачем это вам?
Рынок рекомендательных систем растёт на 24,7% в год (Research Nester), и спрос на специалистов огромен. С этим курсом вы войдёте в топ востребованных профессионалов!

💻

Записаться на курс

#курс

❤

@sb_ai_lab

Please open Telegram to view this post

VIEW IN TELEGRAM

1.3K views14:02

Mashkka про Data Science

Forwarded from RnD CV Team

Всем привет!
Мы выпустили новую статью — HandReader: набор архитектур для распознавания дактиля (англ. fingerspelling) 🚀 Это последовательный показа дактилем (букв из жестовой азбуки), который применяется в основном для слов, являющихся именами собственными.
В работе мы предлагаем универсальные решения для трёх модальностей:
- на основе RGB-кадров,
- на основе ключевых точек,
- и на их сочетании (multi-modal).

Все три варианта архитектур достигают SOTA-результатов на датасетах ChicagoFSWild и ChicagoFSWild+.
А ещё, поскольку до сих пор не существовало открытых данных по русскому дактилю, мы собрали и выкладываем первый в мире датасет — Znaki, содержаший более 1593 размеченных фраз и более 37 тыс. HD+ видео, который был собран глухими и слабослышащими людьми.

Почитать здесь:

📝

HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля

📖

HandReader: Advanced Techniques for Efficient Fingerspelling Recognition

Please open Telegram to view this post

VIEW IN TELEGRAM

1.2K views08:13

Mashkka про Data Science

Forwarded from GigaChat

Please open Telegram to view this post

VIEW IN TELEGRAM

1.3K views08:31

Mashkka про Data Science

Ииии победителем в номинации...

...самая всратая история в моей жизни становится мое посещение премии Generation Awards. История немного выбила меня из колеи, возвращаюсь в нее, наворачивая по Питеру 21ую тысячу шагов... У нас с Питером какая-то взаимная нелюбовь...

Мудрость дня, которую я хорошо усвоила: если в туалете висит табличка "Need help? Тогда звоните НОМЕР" - задумайтесь перед тем как запирать дверь, она здесь не просто так...

1.5K views21:21

Mashkka про Data Science

#пятничныемемасы вдохновлены нашим бурным обсуждением случайного числа 27
За идею спасибо @Yuio_Wert

1.3K views10:51

Mashkka про Data Science

🐾По следам вебинара Технологии продвинутого Data Science: что под капотом?

На вебинаре в OTUS рассказала, про продвинутые методы ML, которые мы проходим на ML.Advanced в Otus. Обсудили, что под капотом у моделей для временных рядов и рекомендательных систем, на каких принципах основан современный RL, в чем мощь Байесовских методов и какие фреймворки можно использовать для AutoML.

👀Запись
✍Слайды

@mashkka_ds

#открытыйурок

Please open Telegram to view this post

VIEW IN TELEGRAM

1.2K viewsedited 17:20

Mashkka про Data Science

🏆Финалист Generation Awards - для меня эта уже победа

Спасибо всем, кто поддержал меня вчера. Было Так невероятно приятно получить от вас столько теплых слов.

Многие ошибочно решили, что меня расстроил результат, но НЕТ! Для меня выйти в финал - это уже победа и я искренне горжусь тем, что вышла в топ.

Спасибо организаторам, что позвали участвовать - очень ценный и полезный опыт для меня, а @yacka_nata за помощь с монтажом.

А вот Питер в очередной раз преподнес мне всратую свинью. Что же случилось? Рассказываю в инсте и на YouTube (warning: много эмоций и немножко мат).

1.2K viewsedited 17:27

Mashkka про Data Science

🗣Выступила на Conversations с рассказом про бенчмарки и LLM

Вчера выступила на Conversations с докладом про оценку LLM: рассказала про вызовы в оценке современных больших языковых моделей и про наши бенчмарки для русского языка. И так приятно, что даже на выступление собрался полный зал, а в кулуарах потом услышала много благодарностей про доклад.

Хорошо, что конференция проходит не в самом Питере, который просто не принимает меня от слова совсем. => доклад прошел как по маслу, а я получила невероятный эмоциональный заряд.

👀Слайды

@mashkka

#трудовыебудни
#llm

1.1K views06:36

Mashkka про Data Science

0:26

Media is too big

VIEW IN TELEGRAM

#justaboutme NAACL'25 vlog

Cегодня в личнорубрике вспоминаю лучшие моменты поездки на NAACL'25 в апреле. Вспоминаем лучшее за 30 секунд.

❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

#mashkka_usa

1.1K viewsedited 18:03

Mashkka про Data Science

#mashkka_reading Подельник начинается в субботу📚

Перечитала любимую классику братьев Стругацких "Понедельник начинается в субботу" - книгу, которая с детства входит в мой топ.

Если вдруг кто-то не читал сей шедевр, кратко напомню сюжет, молодой программист Александр Привалов случайно попадает в загадочный НИИЧАВО (Научно-исследовательский институт Чародейства и Волшебства). Здесь он становится частью невероятного мира, где магия и наука переплетаются в одну странную, но удивительно логичную картину. В этом институте работают настоящие энтузиасты: они изучают бессмертие, воскрешают древних существ и даже пытаются понять, почему человеческие желания такие сложные.

В этой книге замечательно просто все: стремительный и непредсказуемый сюжет, вселенная НИИ, фактурные персонажи, но главное это непревзойденный юмор, по-доброму смеющийся над работой институтов и так точно пародирующий атмосферу в них. Так шутить умеют только братья Стругацкие, и больше никто!

✔️12-я книга за 2025

#mashkka_reading #книжнаяполка #книга #book

1.2K views18:29

Mashkka про Data Science

Forwarded from GigaChat

POLLUX: бенчмарк для оценки творческих способностей AI

🤖

Обычные бенчмарки типа MMLU — это ЕГЭ для нейросетей: выбери правильный ответ из списка. В реальном применении мы используем AI для написания текстов, генерации идей и переводов

POLLUX — первый экспертный бенчмарк для оценки генеративных способностей на русском от специалистов Сбера:

➡️2 100 уникальных заданий (написаны экспертами с нуля)
➡️152 типа задач — от художественных текстов до анализа кода
➡️66 критериев оценки
➡️471 тысяча экспертных оценок
➡️обученные AI-судьи для автоматической оценки

Мы протестировали GPT-4o, Claude 3.5, LLaMA и другие. Оказалось, что даже топовые модели пока уступают людям в творчестве, а выбирать их нужно под конкретные задачи, а не по общему рейтингу

📌Проект открытый — читаем про него тут
📌Пробуем демо здесь

Please open Telegram to view this post

VIEW IN TELEGRAM

1.2K views14:21

Mashkka про Data Science

Forwarded from Kali Novskaya

🌸Deep Research Agents: обзор 🌸
#nlp #про_nlp #nlp_papers

Вышла неплохая обзорная статья про пересечение Deep Research и агентов — Deep Research Agents: A Systematic Examination And Roadmap.

Авторы определяют Deep Research агентов как AI-агенты на базе LLM, объединяющие динамически адаптивные рассуждения, способность к планированию, многошаговый внешний поиск и извлечение знаний и использование инструментов (tools, function calling), а также генерацию комплексных аналитических отчетов для информационно-исследовательских задач.

Приводится подробный анализ работ по теме
— Chain-of-thought, Reasoning
— Tool use, MCP
— Планирование в LLM
— GPRO, PPO, Reinforce++ и как их готовить

Отдельно способность к Deep Research сравнивают на примере бенчмарка GAIA (на нем оцениваются практически все работы).

Открытые вопросы и задачи, которые стоят перед исследователями в 2025:
— Расширение источников информации — когда информации хватит для отчета? Когда и где искать, когда ее недостаточно?
— Fact Checking и информация, меняющаяся во времени
— Асинхронность в выполнении задач и этапов плана у агентов
— Адекватная интеграция reasoning и вывода из внешних тулзов
— Мультиагентные архитектуры и автономное развитие систем с онлайн-RL

Нашу статью MLGym процитировали, опять же! 🥹

🟣

Статья

🟣

GitHub

Please open Telegram to view this post

VIEW IN TELEGRAM

1.2K views09:45

Mashkka про Data Science

#пятничныемемасы
Шла пятница и был дедлайн на System Demo EMNLP. Они держались как могли

833 views20:41

Mashkka про Data Science

🎓МарьИванна идет на выпускной ФКН

На этой неделе был отличный повод выбраться в ВШЭ - пришла поздравить своих магистров-выпускников на выпускной ФКН. Вела у них занятия, связанные с Data Science, а в этот день пришла сказать им напутсвенные слова и искренне порадоваться за них.

Единственная очная встреча выпускников онлайн-программ, и повод для этого прекрасен как никогда. Эти ребята могут по праву гордиться собой: cтать магистром одного из лучших факультетов страны по Data Science - невероятное достижение. И это на 200% их заслуга и результат их упорного труда. А я горжусь своими замечательными краснодипломницами: @juliawolkenstein и @planqua. Таких талантливых и целеустремленных студенток, как они сложно найти!

👏Поаплодируйте им, выпускникам ФКН и всем, кто в этом году окончил тот или иной вуз! Это важный этап в жизни каждого!

#вшэ #фкн #graduate #выпускник #hse

819 views21:58

Mashkka про Data Science

🐾По следам вебинара Как правильно готовить данные для ML-моделей?

На вебинаре в OTUS разобрали основные этапы разведочного анализа данных и то, как правильно "готовить данные" в Python для моделей машинного обучения.
- Что делать с пропусками?
- Как быть с выбросами?
- Зачем смотреть корреляции?
Это и многое другое обсуждаем и применяем в на практике.

👀Запись
✍Слайды
💻Практика

@mashkka_ds

#открытыйурок

Please open Telegram to view this post

VIEW IN TELEGRAM

453 views12:52

2025/07/05 23:42:32
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>