Telegram Web
Семинар про декомпозицию дисперсии в байесовских моделях

▫️ 29 ноября (среда), 17:00 МСК
▫️ Подключение→

Выступает: Максим Кочуров, PyMC Labs

Тема: Декомпозиция дисперсии в байесовских моделях

Аннотация
На семинаре рассмотрим один современный подход к линейным моделям в байесовской статистике: как используя интуитивную методологию можно задавать важности признаков, объясняющий силу модели R2, а также направление зависимостей? Такая методология является достаточно общей, и может быть применима к другим моделям.

Статья для предварительного более подробного ознакомления с темой:
▫️ J.E. Aguilar, P.-C. Bürkner - Intuitive Joint Priors for Bayesian Linear Multilevel Models: The R2D2M2 prior, 2022.
Запись семинара

▫️ Максим Кочуров - Декомпозиция дисперсии в байесовских моделях (1 час 10 минут).
▫️ Презентация в базе знаний→
👍2
Семинар про применение ML в мат. оптимизации

▫️ 6 декабря (среда), 17:00 МСК
▫️ Подключение→

Выступает: Семён Косяченко, к.т.н., руководитель отдела анализа данных и исследований, Цифровая Индустриальная Платформа

Тема: Машинное обучение в задачах смешенно-линейно целочисленной оптимизации

Аннотация
Во многих отраслях совершенно различные оптимизационные задачи сводятся к задачам смешанной линейно-целочисленной оптимизации (СЛЦО). Такие задачи встречаются при составлении расписаний, планировании производства, оптимизации цепочек поставок и др. Для решения таких задач часто применяются специальные решатели (Gurobi, Cplex и др). Компании-производители таких решателей (солверов) постоянно улучшают эффективность своих продуктов, тем не менее множество бизнес и производственных задач оказываются не разрешимы. Решатели разрабатываются за рубежом и из-за этого не всегда могут быть использованы из-за политик импортоземещения.
В то же время, сейчас активно исследуется применение техник машинного и глубокого обучения для решения задач СЛЦО.
В данном докладе автор расскажет о перспективах применения ML для решения задач:
▫️ подбора оптимальных параметров решателя;
▫️ настройки эвристик для снижения размерности задач СЛЦО различными ML техниками.
Более того, будет предложен подход 2-х шагового решателя задач СЛЦО.
🔥2
Материалы про байесовские методы

По следам предыдущего семинара, продублирую в канал подборку от Максима Кочурова:
▫️ Теория: A. Gelman et al. - Bayesian Data Analysis, 2013 (там же по ссылке помимо книги можно найти курс лекции, блог, и пр.);
▫️ Практика: PyMC Example Gallery;
▫️ Продвинутое и углубленное: Michael Betancourt (записи выступлений, статьи, книга и т.д.);
▫️ Лекции от нашего докладчика с уклоном в практику: Max Kochurov - State of Bayes, 2023.

И напомню, что у нас также есть чат сообщества @noml_community, где можно задавать вопросы и делиться полезной информацией. По теме Байеса там коллега недавно тоже книгу рекомендовал:
▫️ A.A. Johnson, M.Q. Ott, M. Dogucu - Bayes Rules! An Introduction to Applied Bayesian Modeling, 2022.

Можно подписаться либо только на канал, либо только на чат, вся информация плюс минус дублируется.
Семинары NoML в декабре

▫️ 06.12 (среда) 17:00 МСК | Семен Косяченко (Цифровая Индустриальная Платформа) — Машинное обучение в задачах смешенно-линейно целочисленной оптимизации;
▫️ 13.12 (среда) 17:00 МСК | Егор Дудырев (НИУ ВШЭ, Университет Лотарингии) — Модели человеческих знаний, или Когда простейшие правила работают на уровне градиентных бустингов;
▫️ 20.12 (среда) 17:00 МСК | Роман Постников (Upgini), Максим Воеводский (Upgini) — Библиотека Upgini для быстрого поиска и обогащения ML моделей готовыми релевантными внешними фичами из открытых и коммерческих источников, включая LLMки;
▫️ 26.12 (вторник!!) 17:00 МСК | Максим Гончаров (Kolmogorov AI), Вазген Амбарцумов (GlowByte AA) — Управление промо-календарём на базе методов прогнозной и оптимизационной аналитики.
👍1
Forwarded from GlowByte Journal
Всем привет! ❄️☃️

GlowByte и партнеры компании Data Sapience и Adastra подали аж 7 проектов на конкурс «Проект года» от Global CIO:

1️⃣ Implementing ML models and a decision support system based on Talys.SDE in the pre-insurance screening process – UzbekInvest
(международный – номинация Analytics and Big Data).

2️⃣ Аналитическая платформа данных СК «Пульс»: от холодного хранилища до real-time-маркетинга – СК «Пульс»
(российский – номинация «Управление и хранение данных»).

3️⃣ Внедрение системы аналитического маркетинга на базе отечественного ПО Data Sapience CM Ocean. Импортозамещение SAS MA – ПАО «Группа Ренессанс Страхование»
(российский – номинация «CRM-системы»).

4️⃣ Аналитическая платформа по противодействию мошенничеству в области автострахования – СПАО «Ингосстрах»
(российский – номинация «Страховые компании и Управление рисками»).

5️⃣ Автоматизация управления данными: перевод функционала управления метаданными и бизнес-глоссарием на импортозамещающее решение – АО «Российский сельскохозяйственный банк»
(российский – номинация «Управление знаниями»).

6️⃣ SyMoMa – System of model management. Система управления моделями – ПАО Росбанк
(российский – номинация «Аналитика и Big Data»).

7️⃣ Повышение эффективности промопредложений в результате оптимизации индивидуальных параметров для аптек – АО «Акрихин»
(российский – номинация «Медицина и фармацевтика»).

📌 До 8 января включительно идет непростой этап голосования, с которым мы просим вас помочь.

Непростой, потому что голосовать могут только зарегистрированные (международная номинация и российские номинации) участники со статусом «Профессионал». Что говорит сайт сообщества:

«Кто такой «Профессионал», который может голосовать за проекты?
У вас статус «Профессионал», если вы являетесь ИТ-руководителем в компании (не поставщике ИТ-услуг) и ваша регистрация на портале Global CIO подтверждена через актуальную рабочую почту с корпоративным адресом».


📌 Дополнительные баллы проектам дают содержательные комментарии «Профессионалов» свыше 200 знаков.

Среди вас и ваших друзей и коллег множество тех, кто смог бы оставить свой голос, по возможности просим вас пройти этот нелегкий путь голосования и комментирования! 🎄☃️
🔥2👍1
Семинар про Модели Человеческих Знаний

▫️ 13 декабря (среда), 17:00 МСК
▫️ Подключение→

Выступает: Егор Дудырев, аспирант НИУ ВШЭ и Университета Лотарингии

Тема: Модели человеческих знаний, или Когда простейшие правила работают на уровне градиентных бустингов

Аннотация
В DS сообществе распространенно мнение, что ML модель может быть либо качественной, либо интерпретируемой. Но существуют задачи, когда модель должна обладать обеими характеристиками одновременно. Например, во время пандемии нужно было срочно решать, каких пациентов подключать к аппарату ИВЛ, а каких отправлять на самоизоляцию. Такая классификация пациентов должна была быть и биологически понятной и математически точной. Также, желательно, чтобы доктора могли принимать решения молниеносно и самостоятельно, не тратя время на взаимодействие с компьютером.
В ходе исследований мы (аспиранты и профессора ВШЭ, AIRI, Harvard Medical School) выделили класс Моделей Человеческих Знаний: логических моделей, состоящих из не более чем 4 бинарных условий. Мы показали что, несмотря на свою простоту, такие модели могут делать предсказания на уровне градиентных бустингов и других чёрных ящиков. Более того, оказалось, что качество предсказаний таких коротких правил почти не падает при переходе на тестовые данные. Единственный вопрос, как можно находить такие Модели Человеческих Знаний за разумное время.
На семинаре будет рассказано про две научные статьи, опубликованные в 2022 году. В первой статье [1] мы ввели термин Моделей Человеческих Знаний и протестировали эти модели на четырёх датасетах из разных областей жизни. Во второй статье [2] мы представили наши первые результаты по разработке алгоритма поиска коротких моделей с максимально возможным качеством предсказаний за пару минут.

[1] E. Dudyrev, I. Semenkov, S. O. Kuznetsov, G. Gusev, A. Sharp, and O. S. Pianykh. Human knowledge models: Learning applied knowledge from the data. Plos one, 17(10):e0275814, 2022.
[2] E. Dudyrev and S. O. Kuznetsov. Towards fast finding optimal short classifiers. CEUR Workshop Proceedings, 3233:23–34, 2022.
👍5
Семинар про поисковик данных Upgini

▫️ 20 декабря (среда), 17:00 МСК
▫️ Подключение→

Выступают: Роман Постников, Максим Воеводский, Upgini

Тема: Библиотека Upgini для быстрого поиска и обогащения ML моделей готовыми релевантными внешними фичами из открытых и коммерческих источников, включая LLMки

Аннотация
На семинаре вы узнаете как быстро ответить на вопрос: “А есть ли внешние источники данных, фичи из которых существенно улучшают качество моей ML модели?” Вы удивитесь, но оказывается, поиск данных для ML алгоритмов гораздо проще делать не в Google, Yandex или Github, пытаясь сформулировать запрос на естественном языке, а использовать готовый эталон с разметкой.
Эксперты Upgini расскажут как быстро и легко находить релевантные фичи из сотен общедоступных и закрытых источников данных, оптимизированных с помощью нейронных сетей и LLM. Ведь LLM — это по сути база слабоструктурированных данных, сжатая алгоритмом сжатия с потерями, с которой можно и нужно разговаривать для извлечения информации.
И все это будет рассмотрено на двух реальных и очень распространённых примерах бизнес задач на базе DS/ML:
▫️ Определение фрода в Fintech сервисах;
▫️ Предсказание спроса для ритейла и E-com.
Семинар про продвинутое управление промо-календарём

А завтра нас ждёт завершающий в этом сезоне и в этом году семинар.
▫️ 26 декабря (вторник!!), 17:00 МСК
▫️ Подключение→

Выступают: Максим Гончаров, Вазген Амбарцумов, GlowByte AA / Kolmogorov AI

Тема: Управление промо-календарём на базе методов прогнозной и оптимизационной аналитики

Аннотация
На семинаре рассмотрим бизнес задачу повышения эффективности промо-акций с точки зрения максимизации прибыли, оборота, среднего чека и долгосрочной ценности клиентов.

На примере этой задачи, посмотрим, как работают совместно многие методы и технологии, которые мы часто затрагивали на наших семинарах NoML в этом году:
▫️ Прогнозные модели для определения эластичности спроса;
▫️ Описательные модели для кластеризации товаров и магазинов;
▫️ Оптимизационные модели для выбора товаров, периода и уровня скидок;
▫️ Feature Store для расчета большого количества переменных ценового контекста;
▫️ Внешние данные из Upgini для более точных пронозов;
▫️ Базовый сценарный и продвинутый причинно-следственный анализ для формулирования гипотез;
▫️ A/B тесты для проверки гипотез и непрерывного улучшения процесса управления промо календарём.

Также в докладе напомним, что мы делаем в платформе Kolmogorov AI, поделимся новостями и планами, и покажем пример решения задачи прогнозного управления промо на нашей платформе.
👍62
Записи семинаров про библиотеки для A/B

За мной оставался должок: 7 и 8 ноября у нас было два доклада про библиотеки и решения для A/B, один от коллег из BigData МТС, второй от нас. В одной из записей отъехал звук, никак не доходили руки поправить. Теперь записи доступны на нашем YouTube канале:
▫️ Артём Хакимов - Ambrosia - Open Source библиотека для работы с A/B тестами и экспериментами (1 час 15 минут).
▫️ Вадим Глухов, Альфия Харламова - Решения Kolmogorov для A/B: открытая библиотека ABacus и корпоративная платформа Continuity (50 минут).


Продублирую сюда также полезные ссылки по этим open-source библиотекам.

Ambrosia от МТС BigData:
▫️ GitHub→
▫️ Telegram-чат: Ambrosia Support and Developing→

ABacus от GlowByte AA и Kolmogorov AI:
▫️ GitHub→
▫️ Telegram-чат: ABacus - Development & Support Chat→
👍1
Запись семинара про задачу промо-календаря

И запись прошедшего в этот вторник семинара:
▫️ Максим Гончаров, Вазген Амбарцумов - Управление промо-календарём на базе методов прогнозной и оптимизационной аналитики (1 час 55 минут).

Следующее мероприятие NoML будет в феврале.

Всех с наступающим НГ!
🎄5🎉2
В новый год с новым сообществом про данные и аналитику!

Команда GlowByte Advanced Analytics представляет новое комьюнити PROДАННЫЕ😎
Будет много очных мероприятий, подкастов-интервью, разборов всевозможных бизнес-кейсов и много чего еще.

Чтобы присоединиться к сообществу и быть в курсе всех событий, необходимо зарегистрироваться→

Также уже можно посмотреть или послушать первое интервью PROДАННЫЕ:
▫️ Диалоги про данные с Никитой Зелинским - руководителем центра компетенций DS / Chief Data Scientist, МТС (1 час 20 минут).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Cообщества GlowByte

Напомним полный список сообществ по разным темам и направлениям, которые развивают коллеги из группы компаний GlowByte:
▫️ Data People - про данные и технологии работы с данными, канал→ и чат→
▫️ BIгуди - про визуализацию данных и BI, чат→
▫️ FineBI - про BI систему FineBI, канал→ и чат→
▫️ PROДАТА - про данные и продвинутую аналитику (чтобы попасть в чат, надо зарегистрироваться)
▫️ NoML - про прикладную математику и технологии продвинутой аналитики, канал→ и чат→
▫️ Процесс-бар - про процессную аналитику и Process Mining (чтобы попасть в чат, надо зарегистрироваться)
▫️ Сарафан - про целевой маркетинг, CVM и многое другое (чтобы попасть в чат, надо зарегистрироваться)
▫️ ZenTao Club - про систему ZenTao - решение для управления проектами (альтернатива Jira), чат→
Истории про Kolmogorov AI

2023 год мы завершили семинаром про платформу и решения, которые разрабатывает наша команда. Пусть тут будут одним списком все истории про Kolmogorov AI:
▫️ Управление модельным риском: кейс (70 минут);
▫️ Управление данными для ML (Feature Store): подход (40 минут);
▫️ Управление A/B экспериментами: демо №1 (3 часа 20 минут), демо №2 (50 минут), кейс (30 минут);
▫️ Управление промо-календарём: подход и демо (1 час 55 минут).

В скором времени поделимся еще одним промышленным кейсом про мониторинг моделей и парой демо-примеров про автоматизацию сложных аналитических расчетов таких, как ПВР, МСФО9 или МСФО17. Следите за анонсами;)
👍3👏1
Мероприятия NoML в феврале

На следующей неделе начинаем новый сезон мероприятий нашего сообщества. Пока план выглядит так:
▫️ 08.02 (четрвег!) 17:00 МСК | семинар | Дмитрий Рыбалко (Yandex Cloud), Дмитрий Жечков (Yandex Cloud) - Обзор кейсов YandexGPT спустя полгода и RAG для работы с внешними знаниями;
▫️ 15.02 (четрвег) 19:00 МСК | созвон | Тренды D&A, часть 2;
▫️ 21.02 (среда) 17:00 МСК | семинар | Вазген Амбарцумов (GlowByte AA) - Маркетинговая оптимизация и задача Next Best Offer;
▫️ 28.02 (среда) 17:00 МСК | семинар | Андрей Зубков (ЕВРАЗ), Михаил Зайцев (Kolmogorov AI) - Федеративный подход к мониторингу моделей.

Обратите внимание, что первый семинар на следующей неделе у нас не как обычно, в среду, а в четверг.
Детальные анонсы и ссылки на подключения будут появляться ближе к делу в канале @noml_digest и чате @noml_community.
🔥2
Семинар про YandexGPT и RAG

▫️ 8 февраля (четверг!), 17:00 МСК
▫️ Подключение→

Выступают: Дмитрий Рыбалко, Архитектор ML-сервисов Yandex Cloud; Дмитрий Жечков, Архитектор Yandex Cloud

Тема: Обзор кейсов YandexGPT спустя полгода и RAG для работы с внешними знаниями

Аннотация
На семинаре мы расскажем про текущее состояние дел вокруг YandexGPT API, поговорим про текущие возможности и планы на развитие. Обсудим, какие кейсы вокруг больших языковых моделей пользуются наибольшей популярностью и какие технологии необходимы для реализации этих кейсов. В частности, детально поговорим про подход Retrieval-Augmented Generation (RAG) и как его можно реализовать на базе технологий Yandex Cloud.
1
Запись семинара

▫️ Дмитрий Рыбалко, Дмитрий Жечков - Обзор кейсов YandexGPT спустя полгода и RAG для работы с внешними знаниями (1 час 20 минут).
▫️ Презентация и ссылки на код в базе знаний→

Кстати у нас появился канал на RuTube, последние полгода уже там, остальное тоже постепенно продублируется.
👍3👎1🔥1
2025/07/13 18:18:21
Back to Top
HTML Embed Code: