Telegram Web
Запись семинара

▫️ Вадим Глухов - Unsupervised Feature Selection (1 час 30 минут).
▫️ Презентация в базе знаний→
🤩2
Статьи про отбор признаков без учителя

Подборка статей по теме прошедшего семинара от нашего докладчика Вадима Глухова @educauchy.

Обзоры и введения:
▫️ J. C. Ang, A. Mirzal, H. Haron, H.N.A. Hamed — Supervised, Unsupervised, and Semi-Supervised Feature Selection: A Review on Gene Selection, 2016 (50-70 минут).
▫️ S. Solorio-Fernández, J.A. Carrasco-Ochoa, J.F. Martínez-Trinidad — A Review of Unsupervised Feature Selection Methods, 2020 (60-90 минут).
▫️ D. Butvinik — Feature Selection — Exhaustive Overview (Medium), 2021 (45 минут).

Алгоритмы, которые рассматривались в докладе:
▫️ SVD-Entropy: R. Varshavsky, A. Gottlieb, M. Linial, D. Horn — Novel Unsupervised Feature Filtering of Biological Data, 2006 (20-30 минут).
▫️ Laplacian Score: X. He, D. Cai, P. Niyogi — Laplacian Score for Feature Selection, 2005 (15-20 минут).
▫️ Simplified Silhouette Sequential Forward Selection: S.F. da Silva, B. Brandoli, D.M. Eler, J.B. Neto, A.J.M. Traina — Silhouette-based Feature Selection for Classification of Medical Images, 2010 (20-25 минут).
▫️ Bayesian Filter K-means: E. R. Hruschka, E. R. Hruschka, T. F. Covoes, N. F. F. Ebecken — Feature Selection for Clustering Problems: a Hybrid Algorithm that Iterates between k-means and a Bayesian Filter, 2005 (15-25 минут).
▫️ Shapley Value Feature Selection: C. Balestra, F. Huber, A. Mayr, E. Müller — Unsupervised Features Ranking via Coalitional Game Theory for Categorical Data, 2022 (25-30 минут).
🔥3👍1
Семинар про мультиагентные системы

▫️ 13 сентября (среда), 17:00 МСК
▫️ Подключение→

Выступает: Сергей Грачев, генеральный директор, Генезис Знаний.

Тема: Мультиагентные технологии: решение сложных бизнес задач на принципах самоорганизации активных агентов.

Аннотация:
▫️ Рассмотрим опыт внедрения решений для управления ресурсами в реальном времени на основе мультиагентных систем (MAS).
▫️ Разберем в деталях две ключевые составляющие подхода к формализации задач на базе MAS: собственно мультиагенты (у каждой цели есть свой агент, обеспечивающий максимально возможное достижение этой цели) и онтологии (все правила управления бизнесом и особенности бизнеса формализуются в базе знаний).
▫️ Сравним между собой классические методы планирования, нейросетевые подходы и MAS. Поговорим о том, почему следующий этап технологической гонки выиграет не тот, кто обучит самую большую нейросеть, а тот, кто создаст самую большую колонию агентов.
🔥3
Семинар про Feature Store Feast

▫️ 20 сентября (среда), 17:00 МСК
▫️ Подключение→

Выступает: Константин Липилин, Тинькофф

Тема: Feast - Open Source Feature Store.

Аннотация:
Если вы когда-нибудь задумывались над темой Feature Store, то наверняка слышали про такой opensource продукт, как Feast.
На нашем семинаре мы познакомимся с Feast поближе и разберем:
▫️ Что такое Feast и из каких частей он состоит?
▫️ Какие задачи Feast решает, а какие нет?
▫️ Как Feast можно использовать для ускорения процесса разработки и внедрения моделей?
👍1
Запись семинара

▫️ Константин Липилин - Feast - Open Source Feature Store (1 час 5 минут).
▫️ Презентация в базе знаний→
Новости из мира Feature Store

Очередная статья про ЗАЧЕМ?
▫️ Why Do You Need a Feature Store? 2023 (14 минут).

Прикольно читать эти истории в таком порядке, цикл замкнулся))
▫️ “Мы ушли от SQL и разработали кастомный FS!” Why We Built Our Feature Store in Snowflake’s Snowpark (And Moved Away From SQL), 2023 (8 минут).
▫️ “Мы ушли от кастомного FS в пользу вендорского решения!” Moving From a Home-Grown Feature Store to Tecton: An Insurance Company’s Story, 2023 (2 минуты) *Публикация сейчас пропала, но веб-архивы помнят всё!
▫️ “Вам не нужен модный вендорский FS, достаточно таблиц и SQL!” A Warehouse Table Might Just Be Enough as a Feature Store, 2023 (3 минуты).

На семинаре обещали апнуть подборку туториалов по Feast, только она уже годовой давности. Заметок с кодом есть очень много, вот например:
▫️ How To Feature Store Using FEAST, 2023 (6 минут).

Истории вокруг Online FS на базе Feast и не только:
▫️ Performance Test for the Python-Based Feast Feature Server: Comparison Between DataStax Astra DB (Based on Apache Cassandra), Google Datastore & Amazon DynamoDB, 2023 (13 минут).
▫️ Running The Feast Feature Store With Dragonfly, 2023 (7 минут).
▫️ Rockset and Feast Feature Store for Real-Time Machine Learning, 2023 (7 минут).
▫️ Build Your Own Feature Store with Streaming Databases, 2023 (12 минут).
▫️ What is an ML Feature Store and How Can ScyllaDB Help You Build One?, 2023 (6 минут).
▫️ Using Tinybird as a Serverless Online Feature Store, 2023 (16 минут).

Касательно глобального ландшафта решений FS, последняя наша подборка кажется здесь. Полноценное обновление ландшафта имени NoML пока не проведено, можно только дать апдейт по парочке новых игроков, которые встретились:
▫️ Fennel;
▫️ Chalk;
▫️ UnifyAI Feature Store (тут пишут, что он там есть FS);
▫️ BlinxAI Feature Store (какие-то скриншоты тут).

А 11 октября будет онлайн конференция по теме:
▫️ Feature Store Summit 2023.
👍4
Тема недели — всякое разное

На этой неделе у нас накладка, и анонсированного семинара про векторные БД не будет (должен быть в следующую среду).

Вместо этого поделимся парой новостей и вспомним пару прошедших ранее мероприятий.
Kolmogorov ABacus

Какое-то время назад наш опенсорсный фреймворк Kolmogorov ABacus увидел свет:
▫️ Код на GitHub→
▫️ Документация→

Про ABacus у нас было выступление весной в рамках небольшого созвона-митапа, теперь его можно посмотреть в виде отдельного доклада:
▫️ Дмитрий Забавин, Егор Шишковец, Вадим Глухов - Kolmogorov ABacus: Фреймворк A/B-тестирования (1 час 20 минут).

На прошлой неделе коллеги из Альфа-Банка и GlowByte опубликовали пост на Хабре про кейс применения фреймворка:
▫️ Оценка эффекта персонализации баннеров в Альфа-Банке с применением библиотеки Kolmogorov ABacus (10 минут).

Также можно вспомнить доклад коллег на нашем весеннем митапе по теме A/B:
▫️ Любовь Кислинская (Альфа-Банк), Александр Косов (GlowByte AA) - Персонализация баннеров на главном экране "Альфа Мобайл" (30 минут).


По всем вопросам по фреймворку Kolmogorov ABacus можно писать напрямую его создателям @dmitry_zabavin, @egorshishkovets, @educauchy или в чат сообщества @noml_community.
👍5
Запись созвона про NoCode и не только

24 августа у нас был созвон про инструменты NoCode. Качество звука получилось не очень, но решили все таки выложить:
▫️ NoCode в DS/ML, 2023 (50 минут).

Обсуждали инструменты с подходами NoCode/LowCode для всех этапов жизненного цикла моделей. В контексте мониторинга и валидации вспоминали про наш инструмент Kolmogorov Predicate. Демо Predicate, которое было у нас весной в рамках небольшого созвона-митапа, теперь тоже можно посмотреть в виде отдельного доклада:
▫️ Альфия Харламова - Kolmogorov Predicate: мониторинг моделей и аналитических метрик, 2023 (35 минут).
В отличие от ABacus, Predicate пока не опубликован в опенсорсе, но распространяется по лицензии Community Edition. Сейчас идёт Private Preview, если интересно получить доступ к этому инструменту для мониторинга ML моделей, пишите мне в личку @psnurnitsyn.

Также на созвоне вспоминали про аналитические приложения и MLGUI. В связи с этим выложили на YouTube архивную запись нашего созвона 2021 года:
▫️ Not Only BI - кейсы аналитических приложений на R Shiny и Dash/Plotly, 2021 (60 минут).
Семинар про Similarity Search и векторные БД

▫️ 4 октября (среда), 17:00 МСК
▫️ Подключение→

Выступает: Александр Волков, GlowByte Advanced Analytics

Тема: Погружение в Similarity Search и векторные базы данных

Аннотация
На семинаре:
▫️ Рассмотрим задачу Similarity Search и ее приложения;
▫️ Поймем, как устроены такие алгоритмы ANN как Annoy и HNSW;
▫️ Узнаем, как устроены векторные базы данных, сделаем обзор основных представленных на рынке cloud и open-source решений;
▫️ Разберём практический пример использования векторных БД.
Мероприятия NoML в октябре

▫️ 04.10 (ср) 17:00 МСК | семинар | Александр Волков (GlowByte AA) - Погружение в Similarity Search и векторные базы данных.
▫️ 11.10 (ср) 17:00 МСК | семинар | *Тема пока на согласовании, возможно, будет созвон в четверг 12.10.
▫️ 18.10 (ср) 17:00 МСК | семинар | Дмитрий Забавин (GlowByte AA) -.Статистический профиль клиента: дескриптивная аналитика в маркетинге.
▫️ 25.10 (ср) 17:00 МСК | семинар | Максим Гончаров (GlowByte, Kolmogorov AI) - Введение в современные методы математической оптимизации.

Детальные анонсы и ссылки на подключения будут появляться ближе к делу в канале @noml_digest и чате @noml_community.
👍3
Математическая оптимизация для бизнеса

Мы продолжаем продвигать тему математической оптимизации и исследования операций в массы специалистов по DS/ML.

На вебинаре 12 октября вместе с коллегами из Yandex Cloud расскажем о том, что такое математическая оптимизация, в чём преимущества её совместного с ML использования при решении бизнес задач, а также как и почему надо всем этим заниматься в облаке.

Обсудим:
▫️ основные компоненты оптимизационных задач;
▫️ типичные бизнес-сценарии оптимизации;
▫️ реальные проекты, в которых использовалась математическая оптимизация;
▫️ примеры решения оптимизационных задач в сервисе Yandex DataSphere.

Докладчики: Дмитрий Рыбалко (Yandex Cloud), Максим Гончаров (GlowByte), Илья Лещёв (GlowByte).

Время и место встречи: 12 октября в 12:00, онлайн.
Зарегистрироваться на мероприятие можно по ссылке.
Запись семинара

▫️ Александр Волков - Погружение в Similarity Search и векторные базы данных (1 час 5 минут).
▫️ Презентация в базе знаний→
Код также появится в базе знаний, но позже.
👍6
На нашем последнем семинаре про Similarity Search и векторные БД мы затрагивали тему LLM. А тут коллеги из Tinkoff AI приглашают всех на очный митап:

Tinkoff AI NLP Monolog Meetup #2

Как изменился NLP Research после выхода GPT-4? И где теперь брать новые идеи для исследований?
Об этом команда Tinkoff AI расскажет на первом осеннем митапе в Москве. Также на встрече ребята обсудят особенности автоматизации поддержки в банке, подходы классификации интентов и разберут нюансы подготовки датасетов для предобучения foundational-моделей.
А После докладов останутся на поболтать и познакомиться с участниками ближе!

▫️ Время и место встречи: 19 октября в БЦ «Водном», сбор гостей 18:30 МСК.
▫️ Не забудьте зарегистрироваться и позвать с собой коллег!
1
По теме LLM

Еще в тему LLM, в августе у нас в NoML был круглый стол, решил всё-таки выложить запись:
▫️ Созвон: Бизнес-кейсы применения ChatGPT (1 час).

А у коллег из AIRI на прошлой неделе был интересный семинар:
▫️ Одна LLM хорошо, а N лучше? Мультиагентный подход — путь к AGI (1 час 30 минут).
Запись вебинара про методы оптимизации

Если вдруг кто-то вчера не дошел до вебинара Yandex Cloud, в котором наша команда GlowByte Advanced Analytics приняла активное участие, то вот запись:
▫️ Дмитрий Рыбалко, Максим Гончаров, Илья Лещёв - Математическая оптимизация для бизнеса в Yandex DataSphere (1 час 5 минут).

А продолжение с дальнейшим погружением будет через пару недель на нашем семинаре NoML, не пропустите;)
▫️ 25.10 (ср) 17:00 МСК | семинар | Максим Гончаров - Введение в современные методы математической оптимизации.
🔥1
Семинар про дескриптивную аналитику в маркетинге

▫️ 18 октября (среда), 17:00 МСК
▫️ Подключение→

Выступает: Дмитрий Забавин, GlowByte Advanced Analytics

Тема: Статистический профиль клиента — дескриптивная аналитика в маркетинге

Аннотация
Очень часто специалисты DS/ML концентрируются в первую очередь на построении моделей максимально возможного качества. Допустим, нам удалось построить очень точную рекомендательную систему, но при оценке бизнес-эффекта мы видим, что он близок к нулю. Это случается, например, потому, что рекомендуемые предложения могут быть downsell’ом или нести за собой каннибализирующий эффект с другими покупками.

Более классический подход к описанию профиля клиента экспертными поведенческими агрегатами, очевидно, имеет свои недостатки. Как перейти от численного описания поведения клиента к характеристическому описанию? То есть как, например, перейти от факта "клиент не совершает транзакции 18 дней" к индивидуальной оценке, насколько это много или мало для данного клиента? Но не потерять при этом интерпретируемость и бизнес-смысл и не уйти в black-box модели.

На семинаре введём дополнительный слой статистических оценок клиентского поведения, который находится между витриной простых экспертных агрегатов и сложными математическими моделями. Поговорим о том, какие дополнительные бизнес-сценарии это позволит нам автоматизировать, и как это скажется на точности самих математических моделей.

Такой подход, например, позволяет:
▫️ оценить индивидуальную склонность клиента к оттоку без построения сложных моделей;
▫️ получить индивидуальную оценку потенциала клиента к росту чека;
▫️ увеличить экономический эффект рекомендательной системы за счет персонализации.

Данную концепцию статистического профиля клиента сопроводим примерами реальных кейсов из различных индустрий.
👍4
Курс A2nced про A/B-тесты

На семинаре в среду Дима вспоминал про наш проект A2nced — образовательный продукт от экспертов практики Advanced Analytics команды GlowByte.

Уже в этот понедельник стартует новый поток интенсива «Погружение в A/B-тестирование», еще остались места.

▫️ Даты обучения: 23-27 октября 2023 г.
▫️ Формат: онлайн (10:00-14:00 по Москве).

Интенсив поможет понять зачем и когда может пригодиться A/B-тестирование, а также прольёт свет на сложные теоретические моменты. Теория не будет оторвана от практики, все ключевые идеи будут реализованы на Python. Обязательная часть программы – разбор практических кейсов.

Интенсив подойдет всем, кто занимается развитием продукта и хочет:
▫️ эффективнее планировать эксперименты;
▫️ точнее формулировать тестируемые гипотезы;
▫️ лучше понять механику и методику проведения А/B тестов.

Вас ждет:
▫️ 5 дней обучения, 20 академических часов;
▫️ живая беседа в формате вопрос-ответ в период обучения с преподавателями;
▫️ практические задания по пройденному материалу;
▫️ (широко известный в узких кругах) сертификат от A2nced x GlowByte.

Преподаватели:
▫️ Дмитрий Забавин, архитектор решений Data Science практики GlowByte Advanced Analytics.
Эксперт в области решения прикладных задач в клиентской аналитике. Реализовал более 30 проектов в основных бизнес-отраслях: ритейл, банки, тревел-компании. Занимается развитием решений по применению геймификации в целевом маркетинге. Отвечает за автоматизацию статистических экспериментов.
▫️ Вадим Глухов, специалист по анализу данных направления клиентской аналитики практики GlowByte Advanced Analytics.
Имеет разнообразный опыт решения ML задач в различных областях, опыт разработки и продуктивизации моделей на базе вендорных и open-source решений, а также большой опыт в разработке и проектировании архитектуры веб-приложений.

Курс платный, узнать больше и записаться можно у Людмилы Локтевой @ldMiila.

Только вот наша славная страница a2nced.ai сейчас лежит(( Описание программы интенсива скину в чат сообщества @noml_community.
👍21
2025/07/14 08:03:09
Back to Top
HTML Embed Code: