Варим МЛ

628 views20:45

Рассуждаю, кто должен управлять AI-продуктами?

#management #Жека

Часто дэйта саентисты жалуются, что бизнес ни хрена не понимает в ML. Это приводит к самым разнообразным проблемам - вбухиваются деньги в проекты, которые и начинать не стоило, усложняется коммуникация, растёт разрыв между ML-метриками и конечными бизнес…

👍1

676 viewsedited 10:00

Варим МЛ

Одна из типичных ошибок при сравнении качества ML-гипотез

#management #Жека

Telegraph

Что такое новизна идей?

Нашёл на реддите интересную заметку про новизну в науке. Автор лаконично, но метко объясняет, почему не стоит путать научную новизну идеи с её сложностью количеством усилий для её реализации удивительностью идеи технической новизной полезностью Заметка написана…

👍2

789 viewsedited 14:25

Варим МЛ

Очень крутой блогпост от Убера про то как они пытаются предсказывать время поездки.
Есть ссылки на интересные статьи, которыми можно шатать табличные данные, например вот, вот и вот (про табнет могу сказать, что на практике хорошо докидывает не сам по себе, а в ансамбле с бустингами). Получается неплохая подборка того, что можно попробовать на практике кроме бустингов.

Что же в посте классного?

- Прикольные идеи для эмбеддинга позиции (потому что если делать глобальную модельку, просто заэнкодить широту и долготу не получится из-за неоднородности)
- Asymmetric Huber Loss (потому что, во-первых, нужно делать робастно, во-вторых, предсказание времени прибытия в меньшую сторону не так критично, как в большую)
- С помощью МЛ предсказывают коррекции грубого ETA из карт, а не само время прибытия
- Рассказывают как решали проблему скорости модельки (например, используют линейный трансформер вместо обычного)
- Рассказывают как они это обучают и сёрвят

То что мне особенно понравилось выделил. Вообще советую прочитать пост целиком: он очень хорошо структурирован, классно объясняет проблему и то как её решают с помощью МЛ.

#таблички #Миша

❤1

868 viewsedited 10:45

Варим МЛ

Выступил на митапе LeanDS аж четвёртый раз, люблю я это дело. Рассказывал про документацию, и её особенности на DS-проектах, но основная мысль, которая прошла через весь доклад, на самом деле несколько шире. При этом она достаточно проста и банальна, но про неё, как обычно, часто забывают =)

Перед внедрением любой практики, инструмента, правила нужно задать себе ряд вопросов. Зачем мы это делаем? Сколько это будет стоить - в деньгах, во времени, в психологическом комфорте команды? Есть ли другие способы достижения тех же целей?

Рекомендую выработать привычку автоматически задавать и пытаться отвечать себе на эти вопросы в самых разных жизненных ситуациях, не только рабочих 😏

https://youtu.be/FETJO-NgU2Q

#management #Жека

YouTube

Документация в DS-проектах | Евгений Никитин, Head of AI @ Цельс

‼️ Полезная, актуальная и при этом полная документация - миф или реальность? В этом докладе обсудим зачем вообще нужна документация (а когда она и не нужна вовсе), поговорим о распространённых проблемах и ошибках, а также посмотрим на примеры специфичной…

1.08K views13:31

Варим МЛ

Раздаю советы по выбору ML-гипотез на проверку

#Жека #management

Telegraph

Что помогает выбирать ML-гипотезы?

Вопрос, которые задают всегда и везде - как выбирать какие ML-гипотезы тестировать, если у вас нет человеческих и компьютерных мощностей гугла? Понятно, что универсального ответа нет, иначе бы нас всех, наверное, уже заменил AutoML. Но я бы сказал, что есть…

👍10

1.21K viewsedited 19:43

Варим МЛ

Наткнулся на пост от ZenML про модели "взрослости" MLOps. В целом штука небесполезная, всегда неплохо себя оценивать по каким-то чек-листам, это даёт информацию о, так сказать, своём месте в мире. Есть ещё вот такая, в чём-то даже более подробная и прикольная модель взрослости от LeanDS.

Но всё-таки полезность и применимость таких матриц ограничены тем, что каждая компания и ML-команда уникальны. Если хочется подойти к вопросу оценки своей инженерии и процессов более обстоятельно, то я рекомендую вам заполнить что-то типа MLOps Infrastructure Stack Template. Я бы, правда, его несколько расширил - вот пример на основе наших продуктов. Мне вообще кажется полезным при составлении любого плана развития сначала представить идеальную картину мира и описать текущую. Если есть точка A и точка B - это сразу облегчает нахождение оптимального пути =)

#Жека #mlops

👍12

1.24K views14:03

Варим МЛ

Думаем о том, что влияет на скорость проверки ML-гипотез

#Жека #management #ML

👍11🔥6

1.18K viewsedited 09:05

Варим МЛ

Всё хочу опубликовать текст про гауссовские процессы, но мне не нравится что получается, так что пока что напишу про VOS: Learning what you don't know by Virtual Outlier Synthesis. Статье уже пару месяцев и на неё уже сделали классные обзоры, но она классная и поэтому пусть тут тоже будет.

Идея статьи — фреймворк для поиска out of distribution примеров (кстати, совсем не обязательно в картинках, задача детекции в статье — просто пример). Для того, чтобы понять как это работает рассмотрим классификатор на три класса в R^2. На первой картинке слева изображена уверенность нейронки в предсказании для этих классов. Очевидно, что если мы просто хотим сделать дискриминатор, то ничто не заставляет сетку выучивать что-то похожее на первую картинку справа, однако это именно то поведение, которое мы бы хотели наблюдать (уверенные предсказания только для примеров, похожих на трейн-сэмплы).
Что можно с этим сделать? Авторы предлагают простое решение: uncertainty-лосс. Для этого предлагается сэмплировать аутлаеры в пространстве эмбеддингов и штрафовать нейронку за бОльшую увереннось в предсказании выбросов, чем in distribution примеров. Делается это с помощью смеси гауссиан: обучаем на пространстве эмбеддингов и сэмплим аутлаеры в регионах с низкой плотностью объектов.
По сути всё :)
Вся остальная статья про то как конкретно это применять в детекции, рассуждения на тему того почему всё работает, куча математики и экспериментов, но основная идея именно такая. Всех интересующихся приглашаю читать саму статью.

P.S.: Если всё-таки хотите про гауссовские процессы — напишите в комментарии, пожалуйста.

#кратко #Миша

👍14

1.25K viewsedited 09:14

Варим МЛ

1.21K views09:14

Варим МЛ

Сказ о том, как мы мигрировали с иностранных сервисов

#Жека #mlops #management

Telegraph

Миграция с иностранных сервисов

Пост не совсем про DS, но тема актуальная. Мы, как и многие стартапы сейчас, оказались в ситуации, когда очень тяжело стало оплачивать иностранные сервисы, а некоторые компании и вовсе отключили платные версии для российских клиентов (например, Slack). Что…

👍19🔥1

1.21K viewsedited 06:43

Варим МЛ

Рассказываю, как можно бустануть метрики на DL-проектах

#ML #Жека

Telegraph

Как бустануть метрики на DL-проекте?

Всем привет, хочу начать неделю с рейтинга штук, которые чаще всего существенно докидывают по метрикам в DL-проектах. Основано на моём личном опыте, по факту ваш индивидуальный рейтинг, конечно, будет зависеть от специфики проекта, зрелости организации, сложности…

👍17🔥3

1.11K viewsedited 14:19

Варим МЛ

Рассуждения о разных подходах к структуре DS-отдела в организации

#Жека #management

Telegraph

Выбираем структуру DS-отдела

Прочитал white paper Practical Guide to Managing Data Science at Scale. Не скажу, что узнал много нового из самой статьи, да и материал больше нацелен на DS-проекты внутри больших компаний, а у нас основным продуктом являются именно DL-системы. Тем не менее…

👍21❤1

1.13K viewsedited 18:00

Варим МЛ

Обещанные гауссовские процессы.

#Миша #ML

Telegraph

Гауссовские процессы

Когда я начинал изучать МЛ у меня в голове всё не могли уложиться гауссовские процессы: что там за матрица, что за ядерная функция? Давайте попробую разложить по полочкам. Для начала представляем себе многомерную гауссиану. Если она будет «круглая», то параметры…

👍8🔥4

1.24K views14:01

Варим МЛ

Друзья, вас уже очень немало, и мы решили, что пришла пора немного познакомиться. Ведут этот канал Жека Никитин и Миша Киндулов, на данный момент мы оба работаем в компании Цельс. Слово нам.

#Жека:
Всем привет, я уже три года руковожу отделом ML-разработки в Цельсе, а DS в целом занимаюсь около 7 лет. Когда-то я неплохо умел шатать картиночные, текстовые и табличные модельки, а сейчас в основном увлекаюсь менеджментом, особенностями DS-разработки, вопросами личной эффективности и прочими эзотерическими вещами. Помимо ML увлекаюсь миксологией, футболом и политикой. Бросил PhD и вернулся в Питер поднимать целину в Цельсе 😌 Подробнее про меня и мои приключения можно почитать, например, тут.

#Миша:
Занимаюсь классическим компьютерным зрением последние 6 лет, примерно 4 года ещё и работаю в этом направлении. Обожаю читать современные статьи, кататься на сноубордах и пить китайский чай. В основном буду писать тут про ML и современные (или не очень) статьи. Надеюсь, будет интересно :)

А ещё, пользуясь случаем, мы хотим задать вам вопрос про контент на нашем канале. Всем хороших выходных!

👍13

1.34K views13:37

Варим МЛ

Какие посты вам наиболее интересны?

Anonymous Poll

42%

Разбор необычных ML-тем (типа гауссовских процессов)

38%

Обзоры на ML/DL-статьи

63%

Бест-практисы и советы по обучению моделей

51%

Размышления про организацию процессов DS-разработки

55%

MLOps и тулинг

30%

Истории из жизни DSеров

184 voters1.58K views13:37

Варим МЛ

Сегодня не очень успешно пытаюсь ответить на вопрос "Как стать синьором в Цельсе?"

#management #Жека

Telegraph

Как стать синьором в Цельсе?

Мы целую неделю ничего не писали, но у нас даже есть оправдание - вчера закончилось наше очередное полугодовое перф-ревью. В связи с этим я хочу поговорить о карьерном росте DL-специалистов. Если ещё точнее - о том как мы с разной степенью успешности отвечали…

👍15😁2

1.64K views12:16

Варим МЛ

Сегодня расскажу про bag of visual words — бейзлайн, который забыли из-за бума свёрточных сетей, при том, что уже в 2011 на ImageNet 1k он давал ≈51% accuracy

#Миша #CV

Telegraph

BoVW – незаслуженно забытый бейзлайн

Я вообще очень сильно люблю всякие классические методы CV (сейчас всё выглядит намного скучнее, везде сплошные сетки) и периодически мне приходилось использовать вот эту забавную вещь, про которую почему-то мало кто знает: bag of visual words. Интересно это…

👍14

2.05K views09:51

2025/07/13 18:27:10
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>