Telegram Web
За окном – обманчивая осенняя погода. Зато статья на Medium «Осваиваем создание незабываемого дашборда» (VPN) не подвела и полностью оправдала ожидания. Опытный аналитик из Кореи рассказала про великолепный фреймворк для визуализации данных. В упрощенном виде он сводится к вопросам:

1️⃣ Кто конечные пользователи дашборда?
2️⃣ Почему им необходимо увидеть эти данные? Какое решение им нужно принять?
3️⃣ Какие ключевые метрики необходимо знать для принятия решения?
4️⃣ Как пользователи будут использовать дашборд?
5️⃣ Как часто к нему будут обращаться?
6️⃣ Как структурировать его так, чтобы последовательно изложить читателю все данные?

Не смог пройти мимо статьи из цикла о казуальном машинном обучении. В прошлый раз мы обсуждали, что такое uplift-моделирование и где оно может пригодиться. В новой статье ML-инженер Arthur Cruiziat рассказал, как с помощью модели улучшить удержание клиентов (VPN). Это яркий пример реальной бизнес-ценности от ML. Статья описывает все этапы повышения Retention, начиная с анализа оттока пользователей и определения действий по их удержанию и заканчивая описанием моделей и оценкой результатов моделирования. Python-скрипты прилагаются.

Когда нужно определить влияние фактора Х на пользователей, все вспоминают А/Б-эксперимент. Но у него есть ограничение – две группы должны быть выбраны случайным образом. Если рандомизация невозможна, в игру вступают альтернативные методы исследования: Difference in Differences (DiD), Regression Discontinuity Design (RDD), Instrumental variables и Matching. В основе лежит идея квази-эксперимента. Он оценивает причинно-следственные связи в условиях, когда невозможно провести полностью контролируемый эксперимент. Автор в блоге ВкусВилл разбирает принципы четырех методов и делится опытом их применения.

Пиши, какие еще темы ты хочешь видеть в дайджестах. Я учту твои пожелания 🧐.

#дайджест
Друзья, привет!

Последние полгода я полностью погружён в мир метрик. Да, я – тот самый человек, который на вечеринке обсуждает не отпуск, а Retention Rate. Что поделать, метрики – это невидимые герои бизнеса. Именно они говорят, жить продукту или нет, без них не принимаются никакие серьёзные решения.

Я глубоко изучил популярные фреймворки, прочитал несколько книг, прошерстил тонну статей и всё это объединил в серию постов в Telegram. Получился целый мини-курс!

Если ваши любимые цифры – это не только количество лайков на фотке с котом, но и что-то более серьёзное, вроде LTV или CAC, вам точно будет интересно! Ссылки на посты ниже – сохраняйте и делитесь с друзьями.

База
▪️Что такое метрика?
▪️Фреймворки для работы с метриками
OKR
▪️Цели и ключевые результаты (OKR)
▪️Книга.Измеряйте самое важное
NSM
▪️Метрика Полярной звезды (NSM)
▪️Почему Revenue и Profit плохие кандидаты в NSM
▪️Книга.The North Star Playbook
Иерархия и пирамида
▪️Дерево или иерархия метрик
▪️Пирамида метрик
▪️Построение пирамиды метрик
Опыт Amazon
▪️Опережающие и запаздывающие индикаторы
▪️Маховик Amazon
▪️Книга.Стратегия Amazon
Для конкретной задачи
▪️Фреймворк AARRR
▪️Фреймворк HEART
▪️Фреймворк PULSE

А я тем временем продолжу копаться в теме и рассказывать вам, как и зачем использовать #метрики на практике.
Список критериев классного джуна

Я часто провожу технические собеседования и через меня в компании попадают ребята всех грейдов. Ранее описывал свой вижн синьора, а теперь поговорим про джунов. Вот список критериев:

Горящие глаза
Они важнее образования. В них виден тайфун, энергия которого позволит наработать опыт и закрепить знанием.

(Само)образование
Тем не менее, образование имеет значение. В CV я рад увидеть технические вузы, математические и физические факультеты. Но я не садист и понимаю, что бэкграунд у всех разный. Знания можно добрать опытом и самообразованием. Опыт у джунов впереди, а вот обилие сертификатов с курсов может стать козырем.

Пэт-проекты, стажировки, опыт работы
Джун – это не человек без опыта. Небольшой опыт может и должен быть. Он приобретается на стажировках, при создании своих проектов и проектов в рамках курсов. Работа по профилю, пусть и не продолжительная, тоже приветствуется.

Ищет интересные задачи, знания, крутое окружение
Так выглядит правильная мотивация для джуна, а не деньги. Джун – это инвестиция компании с целью получить эффективного работника позже. Поэтому на первых порах искать нужно не мидловские зарплаты, а благодатную среду для обучения. Не стоит гнаться за деньгами, которые и так придут со временем.

Прыгуны – на карандаше (читай: «нет»)
Если человек прыгает из компании в компанию, нигде не проработав и полугода, то он джун. Даже если совокупный опыт 5 лет. Для компании такие ребята – рискованная инвестиция. Деньги на рекрутинг, онбординг и обучение прогорят, если человек уйдет через полгода.

Если ты ищешь работу аналитика и имеешь профильный опыт от 1,5 лет, то редактируй резюме и присылай мне @romanchuk_roman. Я обязательно отвечу, а твое резюме попадет в ТОП-овые компании.

#мысли
Привет! За окном 7 октября, но я притворюсь, что сегодня 5-е, и поздравлю ребят, кто преподает и учит. Вы достойны не одного праздника в год, а еще одного выходного в месяц. Учителя, с праздником! Вы крутые 😎🤘🏻

А теперь дайджест.

Я советовал много статей, где авторы использовали математические модели, чтобы предсказывать поведение рынка. Но задачу можно решить, не углубляясь в формулы. Например, запустить исследование по методу Дельфи. Это анонимный опрос экспертов, который проводится в несколько этапов. На одном из них экспертам обязательно показывают предварительно обработанные результаты исследования, чтобы те скорректировали свой ответ. Метод дорогостоящий, но позволяет освежить взгляд на проблему.

Павел Каравашкин поделился принципами лидерства, которые он выработал за годы работы. Опыта у него много и есть, чему поучиться — он руководит командой разработки платформы T-API и развивает сообщество системных аналитиков в Т-Банке. Я выписал главные советы руководителям:

📌 Создавать больше, работая меньше.
📌 Работать с удовольствием.
📌 Быть верным команде, продукту, компании.
📌 Нанимать людей с подходящими софт-скилами (они очень важны!)
📌 Подкидывать идеи при беседе «один-на-один».
📌 Заработать авторитет, эффективно выполняя задачи и решая проблемы.
📌 Убедиться, что в команде нет токсичного человека.
📌 Научить команду организовать работу без руководителя.

Павел Левчук на Medium (VPN) продолжает разжевывать непростую метрику LTV. В июле я делился его статьей о том, в каких случаях полезно знать LTV. В этот раз Паша пошагово показал, как спрогнозировать метрику. Статья стартует с этапа сбора данных постепенно погружая в детали моделирования метрики путем аппроксимации кривой LTV.

А какой подход к подсчету LTV используете вы?

#дайджест
Аналитика про аналитиков

Ты аналитик? Работаешь с данными? Ребята из NEWHR Data запускают очередное исследование рынка нашей профессии.

Я сам регулярно участвую в этом исследовании, ведь всегда интересно следить за трендами, рейтингом работодателей и уровнем зарплат.

Вот несколько инсайтов 2023 года:

➤ Зарплаты у аналитиков в прошлом году росли чаще, чем по IT-отрасли в целом. Такая же картина была в 2021-м.
➤ Более трети продуктовых и дата-аналитиков очень хотели работать в «Яндексе», «Авито» или «Авиасейлс».
➤ Плюс ребята составили список из 500+ экспертов, видеоблогов и подкастов, за которыми следят продуктовые и дата-аналитики.
Больше инфы — в полном отчёте.

 Опрос займёт около 20 минут. Участники получат ранний доступ к результатам и приглашение на закрытый эфир с инсайтами исследования.

 Заполнить анкету
В 1960-х в автомобилях были повсеместно установлены ремни безопасности, дабы уменьшить количество смертей при авариях. Это дало результат: гибель на дорогах сократилась на 72%. Вот только обращений в больницу стало больше. Если раньше человек погибал при ДТП, то теперь получал серьезные травмы. Люди не знали про статистику смертности. Поэтому среди населения распространилось мнение о том, что ремни безопасности повышают риск травмы.

С похожим заблуждением столкнулся математик Абрахам Вальд, описавший ошибку выжившего. Во время Второй мировой ему поручили проанализировать повреждения вернувшихся из боя самолетов, чтобы сократить потери в авиации. Он понял, что критические удары пришлись в тех зонах, которые на вернувшихся самолетах были повреждены меньше всего.

Ошибка выжившего – одна из систематических ошибок отбора. Она возникает при анализе только успешных случаев и игнорировании данных о тех, кто не прошел отбор. В итоге мы получаем неполный набор данных, смещенный в сторону успешных случаев.

При анализе клиентов мы собираем статистику «выживших». Это пользователи, которые успешно прошли сквозь воронку и дошли до покупки. Но есть и те, кто сошел с пути и потерял интерес к продукту.

Если мы игнорируем «сошедших» пользователей, то совершаем несколько ошибок. Во-первых, сужается круг потенциальных покупателей. Например, строительный магазин постоянно увеличивает выбор обоев, чтобы привлечь больше клиентов. При этом бизнес мог бы подумать над расширением выбора садовой мебели для притока других категорий покупателей.

Во-вторых, мы вычеркиваем из анализа людей, которые потерялись на этапах воронки. Так мы рискуем ошибочно приписать успех незначительным факторам или упустить ключевые, приводящие к неудаче.

Чтобы избежать ошибки выжившего, важно увидеть «пропавшие» данные и собрать реальную картину. Замечать искажения нам помогают исследования клиентов. Также существуют статистические методы, например коррекция Хекмана для учета систематических ошибок отбора.

#аномалии
🐢 В Яндекс Метрику подвезли Measurement Protocol

В Google Analytics протокол существует с 2013 года, но Яндекс Метрика только сейчас усложнила архитектуру сбора данных и подвезла долгожданное обновление! Видимо, назрела пора отвечать на запрос рынка.

Если вы не в теме, то рассказываю. Measurement Protocol – это инструмент для отправки данных о взаимодействиях пользователей напрямую на сервера Метрики через HTTP-запросы. Например, вы можете дополнить визит пользователя информацией о тех страницах, где счетчик не установлен, обогатить данные о качестве лида или отправить офлайн-конверсию.

Measurement Protocol не заменяет автоматический сбор данных с помощью счетчика Метрики, а расширяет его возможности. Он помогает отслеживать действия пользователей как на стороне клиента, так и на стороне сервера, и собрать данные, которые не может предоставить веб-счетчик. Это полезно в условиях ограниченного клиентского сбора, например, из-за блокировщиков, отсутствия счетчика Метрики на странице или правил приватности.

Учтите, что у Measurement Protocol есть временные ограничения. Данные могут быть записаны только в течение 12 часов с момента завершения визита. Дополнение визитов по истечению 12 часов невозможно. Для внесения данных в предыдущие визиты используйте передачу офлайн-конверсий. Ребята как раз выкатили крупное обновление.

#новости #яндексметрика
Please open Telegram to view this post
VIEW IN TELEGRAM
Ура, дайджест!

Методы, которые используют в A/B-тестировании — t-тест, CUPED, CUMPED и стратификация — в своей основе опираются на линейную регрессию. Если копнуть глубже, эти подходы просто уменьшают дисперсию, добавляя в модель важные переменные. Так мы точнее можем оценить, скажем, как количество дней с активными промо-акциями влияет на недельную выручку в магазине. Разбирались в линейной регрессии ребята из команды Ad‑Hoc X5 Tech. Они добавили ссылки на другие источники, чтобы мы могли заполнить пробел знаниях, если споткнулись на одном из этапов. Мне понравился онлайн-учебник Causal Inference for The Brave and True. Пожалуй, я добавлю его в заметки.

Согласитесь, как клиентам нам удобнее связаться с интернет-магазином или техподдержкой в мессенджерах, чем использовать онлайн-консультант на сайте. Но для бизнеса уход с сайта — серая зона, где невозможна аналитика конверсий. Недавно я вспомнил про одну полезную статью, в которой специалист по сквозной аналитике Олег Рассказов предложил решение этой проблемы. Он описал схему реализации отслеживания сообщений WhatsApp, Telegram-ботов и VK сообщений. Подход эффективный, хотя и не универсальный и достаточно изощренный. Но опытному аналитику с опытом разработки будет по плечу.

Поисковое ранжирование — это алгоритм, который используют поисковые системы для оценки и сортировки результатов по уровню соответствия запросу. В итоге пользователь видит наиболее полезный и качественный результат поиска. Для такого сервиса как Авито, где вращаются миллионы объявлений и десятки категорий пользователей, ранжировать результаты крайне непросто. Как ребята справляются с этим, какие критерии качества ранжирования выделяют и на каком этапе подключается эвристика, читай в блоге AvitoTech на Хабр.

#дайджест
Читать статьи — хорошо. Но даже лучшие из них не заменят полноценной книги.

📚 Доверительное А/В-тестирование
/ Trustworthy Online Controlled Experiments
Авторы: Рон Кохави / Ron Kohavi, Диана Тан / Diane Tang, Я Сюй / Ya Xu

Проведение А/В-теста в первый раз — как задача со звездочкой. Вот прошел очередной час и ты уже мечтаешь найти решебник с ответами, как когда-то в детстве мы списывали готовые домашки по математике. К сожалению, все решебники остались в школе. Но ответы найти можно. Правда потребуются несколько свободных вечеров и небольшая книга на 300 страниц.

Ее авторы — люди, которые понимают природу эксперимента. Рон Кохави возглавлял команды экспериментальных платформ в Amazon и Microsoft. Я Сюй — руководитель команды дата-саентистов в LinkedIn, кандидат математических наук со степенью в экономике. Диана Тан заслужила звание Google Fellow, высший уровень признания инженерных достижений в компании.

Когда я впервые раскрыл книгу, на меня смотрела седьмая глава о метриках для эксперимента. Я продолжил листать. Там было все, о чем я так или иначе рассказываю в блоге: терминология, пример постановки эксперимента от А до Я, проверка достоверности результатов, углубленная мат.статистика и часто обделенная этичность экспериментов.

Я стараюсь публиковать важную теорию и безумно благодарен вам, что вы ее читаете и реагируете. Но чего в блоге воплотить не могу, так это детализацию и последовательность изложения. На такое способен только хороший учебник. Например, этот.

🔗Книгу на русском ищи на OZON. Издание на английском — на Аmazon.
Пробежаться по содержанию можно на Google Книги.

#книга
Нужно поработать в разных компаниях, чтобы быть действительно опытным

Я часто вижу людей, особенно на руководящих постах, которые выросли и построили карьеру в одной-единственной компании. Это не плохо. К такому склонны трудолюбивые и надежные сотрудники. Но их главный минус — отсутствие насмотренности.

Ребята часто не осознают, как по-разному можно настроить процессы и подходить к решению вопросов. Такой сотрудник воспринимает внутреннюю кухню альма-матер как абсолютную истину. В итоге человек закостеневает и начинает узко мыслить.

Я не призываю каждые два года менять работу. Наоборот, я за выстраивание доверительных и долгосрочных отношений с работодателем. Но нужен баланс. Если вы работаете в компании долго и чувствуете, что перестали учиться, пора переходить на новое место. При прочих равных, человек, поработавший в нескольких компаниях, знаком с бОльшим количеством технологий и более подкован в вопросах менеджмента и фреймворков.

Если есть причины не менять работу, то старайтесь развивать насмотренность осознанно. Например, смените проект или команду внутри компании, участвуйте в нетворкингах с коллегами, обменивайтесь опытом и мнениями.

Чтобы не быть зажатым в рамках майндсета одной компании, ищите альтернативный опыт вовне: посещайте профильные конференции (в идеале — оффлайн), регулярно читайте блоги коллег, слушайте подкасты, общайтесь в telegram-сообществах. Главное — добирайте насмотренность. Иначе можно застрять в прошлом и отстать от рынка.

🤔Что думаете, стоит ли периодически менять компании? Или вы за стабильность?

#мысли
Доброго послепраздничного утра всем!

Все начинается с простого. Так подумал Rohit Patel, руководитель отдела по работе с данными в Meta* GenAI, и принялся объяснять, как работают большие языковые модели с помощью базовой арифметики. Цель статьи — демистифицировать LLM, сделав концепции доступными для всех. Несмотря на название, легким материал не назовешь. Автор рассказывает о структуре и обучении нейронных сетей и разъясняет, как машина может угадывать и генерировать предложения. Если вы давно порывались разобраться в теме, статья станет хорошим началом для первого погружения.
* деятельность организации запрещена на территории РФ

Один крупный региональный банк выкупил банк поменьше и собирается объединить две клиентские базы. Дата-инженеры переглянулись — задача ведь со звездочкой. Во-первых, нужно учесть пересечение клиентских записей. Во-вторых, избавиться от уже имеющихся внутри систем дубликатов — повторных записей с ошибками, опечатками и устаревшими данными вроде девичьих фамилий. При этом нужно умудриться не объединить братьев-близнецов с созвучными именами. В-третьих, не допустить ошибок, переписав кредит на другое имя. Ребята из HFLabs решили задачу за три месяца. Их алгоритм способен за час найти дубликаты среди 100 миллионов записей.

Опытные дата-аналитики знают все про хранение и версионирование кода, понимают разницу между Git и GitHub, правильно форматируют SQL-запросы и шарят за CI/CD. Слишком много новых слов? Не унывай! Настя Кузнецова и Дмитрий Аношин подготовили две статьи о том, как работать с SQL-запросами. Первая статья объясняет, почему хранить варианты кода в виде файлов на Google Диске — плохая идея. Вторую можно назвать гайдом по работе с Git применительно к SQL-запросам.

#дайджест
Как-то я наткнулся на новость: «Завтрак может помочь подросткам справиться с ожирением». Автор ссылается на исследование, которое показало, что школьники с ожирением чаще других пропускают завтрак. Заголовок намекает: если ребенок будет завтракать, то ожирение ему не грозит. Так ли это?

Не совсем. Да, видна закономерность: стройные подростки завтракают, а дети с ожирением начинают прием пищи в обед. Данные указывают на корреляцию между двумя переменными: съеденные завтраки и ожирение. Но зная только о корреляции, нельзя делать выводы.

Корреляция — это статистическая мера, показывающая степень и направление взаимосвязи между двумя переменными. Она ничего не говорит об их влиянии друг на друга. Мы не можем заявлять, что, чтобы похудеть, подросткам нужно регулярно завтракать. Ожирение может вызывать третий фактор, например переедание на ночь. Поэтому подросток просыпается сытым и не завтракает. Тогда лучшим советом будет правильно и вовремя ужинать, а не завтракать.

Корреляция может быть случайной. Вот целый список забавных совпадений.

В новостной заметке автор принял корреляцию за причинно-следственную связь, при которой одно событие напрямую влияет на другое, и такое влияние доказано. Когда врач прописывает лекарство от головной боли, он основывается на доказанной связи между химическим веществом и его влиянием на организм: боль пройдет, если принять таблетку.

Чтобы доказать, что одна переменная влияет на другую и это не совпадение, должны соблюдаться два условия:
✔️нет третьего фактора, влияющего на обе переменные;
✔️есть прямая связь во времени между изменениями в одной и в другой переменных.

К путанице между корреляцией и причинно-следственной связью также приводят когнитивные искажения, например иллюзия контроля. Нам кажется, что мы знаем о продукте все. Из-за этого отметаются те факторы, которые не укладываются в желаемую картину. Справиться с этим поможет адекватно проведенный А/Б-тест.

#аномалии
Доброго утра!

Менеджеры Самоката каждый день ломают голову, как подобрать ассортимент товаров с учетом предпочтений покупателей и вместимостей складов. Чтобы облегчить процесс, продуктовые аналитики из Ecom Tech проанализировали связи между категориями товаров и нашли комплиментарные товары — айтемы, вроде помидоров и огурцов, которые чаще всего покупают совместно. Из интересного: к курице обычно заказывают шампиньоны и жирные сливки, а влажный кошачий корм берут сразу несколькими пачками разного вкуса. Теперь, добавляя курицу на новый склад, менеджер может проверить, продаются ли там жирные сливки. Вот пример аналитики, напрямую влияющей на средний чек.

А что, если я скажу, что порой вычисления на скорую руку важнее, чем супер-пупер модели? Когда CMO спрашивает, можем ли мы подготовиться к незапланированной конференции к пятнице в рамках бюджета Х, он не ждет точных цифр. Чтобы оценить рыночные возможности стартапа для понимания его потенциала роста, хватит и калькулятора. Идея Торстена Вальбаума, руководителя отдела стратегии и аналитики в Uber, звучит здраво (VPN). В статье он рассказывает, в каких случаях можно пренебречь точностью расчетов и как сделать это корректно. После чего можно не тратить время зря и переходить к следующей задаче.

Этим летом бывший бренд-директор Nike опубликовал разбор маркетинговой ошибки, длиной в 4 года. С 2017 года компания начала ориентироваться на стратегию прямых продаж. В 2020 году на роль президента и СЕО пришел IT-шник Джон Донахью, который ранее возглавлял Ebay. Он продолжил стратегию компании: усилил онлайн-торговлю и уменьшил число партнеров в рознице, включая разрыв с крупными ритейлерами. Как итог: потеря 25 млрд долларов рыночной стоимости и обвал цены акций на 32%. Статья на Medium (VPN) разбирает, где Nike облажался с data-driven подходом, и почему стоит анализировать поведение тех покупателей, чьи голоса не слышны.

#дайджест
Рассказать о финансовом управлении компанией доступно и понятно, без перегруза специальной терминологией, но при этом чтобы было полезно для специалистов разного уровня, а также для нефинансистов (например, продуктовых аналитиков и продакт-менеджеров) – весьма непростая задача.

📚«Профессия финансист. Как в современном бизнесе мотивировать людей и управлять финансами, не забывая про риски»
Автор: Денис Дубовцев

Денис Дубовцев – финансовый директор технологических компаний с бэкграундом корпоративного банкира и опытом международного предпринимательства. Мне довелось поработать с Денисом несколько лет в финансовом маркетплейсе Сравни. Мы вместе внедряли целеполагание по OKR, принятие решений на базе цифр, разрабатывали командные P&L, гибкое планирование и продуктовое бюджетирование по лучшим agile-практикам.

«Профессия финансист» – пособие по внедрению гибкого финансового управления для всех – от стартапов и малого бизнеса до компаний, готовящихся на IPO. Денису удалось передать нюансы построения адаптивного управления финансами и рассказать об основных ловушках и препятствиях на пути, а также способах их решения.

В книге 10 глав, которые описывают ключевые, с точки зрения автора, зоны ответственности финансового директора – люди, отчетность и планирование, управление активами, контроль рисков. Много иллюстраций, которые хорошо дополняют текст, помогают понять, запомнить и легко воспроизвести фреймворки в собственной работе.

🔗 Книга доступна в бумажной версии на Ozon, в электронных форматах и аудиоверсии на Литрес и на сайте автора.

#книга
Синдром самозванца 🙀

Это то угнетающее чувство, когда ты не считаешь себя равноправным членом команды. Синдром — не новомодная блажь. Его описали психологи Полин Кланс и Сюзанна Имс в 1978 году применительно к образованным женщинам, которые сомневались в своих знаниях и боялись, что их разоблачат.

Синдром самозванца — это неспособность осознать и принять свой успех. Из-за этого «самозванцы» глубоко сомневаются в себе, испытывают тревожность и депрессию. Они боятся, что их раскроют и назовут мошенниками, хотя окружающие отмечают их успехи и профессионализм. Такие сотрудники настороженно реагируют на похвалу и стараются работать больше других, делать все идеально, быть на связи в нерабочее время и праздники.

Избавление от синдрома скрыто в его определении: нужно принять то, что ты — умничка. Ты работаешь там, где работаешь и зарабатываешь столько, сколько зарабатываешь, потому что достоин этого.

Парадоксально, но синдромом самозванца страдают люди с серьезными профессиональными достижениями. Он выглядит как когнитивное искажение, при котором человек не может объективно оценить собственные успехи. Синдром сигнализирует о том, что ты самокритичен и способен видеть свои слабые стороны. Поэтому я бы предложил не бороться с ним, а направить его в конструктивное русло.

✔️ Признай, что синдром самозванца — это про тебя. Так будет проще игнорировать тревожные мысли вроде описанных выше.

✔️ Попроси коллег и руководителей дать честную оценку твоей работы. Это поможет понять, как тебя воспринимают со стороны. Спроси старших коллег, какие харды или софты тебе стоит подтянуть.

✔️ Сфокусируйся на прогрессе, а не на совершенстве. Твоя задача — не выгореть, а методично улучшать навыки. В процессе ты столкнешься как с успехами, так и с ошибками. Будь готов принять и похвалить себя за первые и сделать правильные выводы из вторых.

#мысли
Сегодня второе декабря, а значит осталось 29 дней до нового года.

На повестке дня: матрица компетенций. Я подобрал две статьи от команды Авито. Первая посвящена росту сеньор-аналитиков. Перед ними открыты два пути: экспертный и менеджерский. Они различаются компетенциями, обязанностями и трудностями, с которыми придется справляться. Стоит знать об этом перед тем, как сделать выбор. Так ты, помимо прочего, убережешь себя от выгорания. Вторая статья — про рост дата-саентистов внутри Авито. Ребята из команды Data Science рассказывают, кого они считают мидлом, почему поощряют инициативу и дают советы, как развиваться в профессии. Прочитай обязательно, если подумываешь о карьере в DS.

Обилие документации, зацикленность на сиюминутных целях и предвзятость подтверждения — это одни из частых ошибок при продумывании стратегии работы с данными. Консультант по вопросам дата-стратегии Ян Мескенс в недавней статье на Medium (VPN) описал целых девять ошибок. Но не для того, чтобы упрекнуть нас. Он старается выдать путеводитель, который поможет установить недостатки и улучшить действующую стратегию. Главная причина многих проблем — дыры в организации на разных уровнях. Например, отсутствие коммуникации между отделами, непонимание целей бизнеса и недоверие к ним. Его советы будут работать и в других сферах.

Я наткнулся на прикольные SQL-лайфхаки (VPN), многие из которых могли пройти мимо вас (мимо меня так точно). В основном они ориентированы на продвинутого дата-спеца. Например, если ты часто работаешь с сырыми данными и тебе приходится удалять дубликаты или запрашивать последние изменения, то приглядись к оконной функции ROW_NUMBER. Если ты используешь обобщенные табличные выражения (CTE), то тебе может пригодиться расширенная функция recursive CTE.

#дайджест
🚀 Матрица компетенций аналитиков данных

Написал статью про такой незаменимый для любой компании инструмент, как матрица компетенций.

Сотруднику она помогает понять, где он находится на карьерном пути, какие навыки стоит прокачать и как построить маршрут к новым вершинам. Для руководителя — это способ системно развивать команду и объективно оценивать её достижения.

Когда я создавал матрицу, то вдохновлялся лучшими практиками от Яндекса, Авито и AGIMA. Особенно впечатлила матрица Яндекс Такси — настоящий эталон для создания понятной и продуманной системы.

В статье вы найдете информацию о том:
🔹 как устроены карьерные треки аналитиков,
🔹 как проходит защита грейда,
🔹 и как внедрить матрицу в культуру компании.

Читайте, адаптируйте, используйте!
Рад поделиться опытом.

#статья
Как это было: конференция «Продукты 24»

Наконец-то дошли руки поделиться записью прошедшей конференции «Продукты 24»! Главным организатором выступил Т-Банк, но к нам также присоединились звёздные спикеры из Яндекса, Сбера, DoDo и Авито.

Конференция была создана для продакт-менеджеров, аналитиков, продуктовых дизайнеров, маркетологов и исследователей.

Было два потока: «Витрина вдохновения» о продуктах, изменивших индустрию и инсайтах из науки и искусства. А также «Полка решений» о том, как данные и технологии помогают создавать успешные продукты и укреплять лояльность.

Выступления, которые нельзя пропустить:
🔹Виктор Тарнавский, директор по искусственному интеллекту, Т‑Банк: «Этот фарш назад не провернуть: LLM и будущее пользовательского опыта».
🔹Роман Халкечев, CDO, Яндекс Поиск и Реклама: «Нейро — поиск будущего».
🔹Кирилл Николаев, директор по аналитике, Т‑Банк: «Vivere vel mori negotium, productum, mutatio».

Конференция удалась на все 💯: никакой воды, только полезные и вдохновляющие материалы. Если хотите зарядиться идеями и прокачать свои навыки — обязательно посмотрите запись.
Всем доброго утра! У нас последний дайджест уходящего года.

Т-Банк сделал языковые модели доступными всем. Толя Потапов, руководитель команды разработки фундаментальных моделей, рассказал про новую разработку: большие языковые опенсорс-модели T-Lite на 7 млрд параметров и T-Pro на 32 млрд. Чем параметров больше, тем модель умнее, быстрее и мощнее. Компания целилась в опенсорс специально. Так Т-Банк подтверждает звание технологической компании и дает толчок к развитию всей индустрии. Помимо прочего, опенсорс позволяет получать большое количество фидбеков и знаний с рынка.

Исходные данные всегда содержат дубликаты, ошибки и выбросы. Чтобы они не повлияли на выводы, нам требуется избавиться от лишнего. Дата-аналитик Nikita Prasad на Medium (VPN) рассказала про пять часто используемых SQL-запросов для очистки сырых данных: работа с NULL-значениями, форматирование и стандартизация данных, удаление «нежелательных» символов вроде лишних пробелов и знаков пунктуации, удаление дубликатов и работа с выбросами. Если тебе показалось, что это базовая база — так и есть. Но я за то, чтобы время от времени освежать теорию.

Сколько ты зарабатываешь? Пиши в комментариях. Согласен, не стоит спрашивать такое в лоб. Но иногда так полезно знать ответ. Например, банк должен понимать, какую максимальную сумму кредита можно предоставить клиенту. То, что раньше клиент нехотя вписывал в анкету, теперь собирают коварные аналитики коварными алгоритмами. Достаточно получить согласие клиента и сделать запрос в сервис «Цифровой профиль». Тут тебе и электронная трудовая, и социальные отчисления, и все недвижимое и движимое. Бери данные и прогнозируй доход вдоволь. Как подобрать подход к моделированию расскажет статья в блоге Альфа-банка.

#дайджест
200+ экспертов и каналов, за которыми следят аналитики

Мои друзья NEWHR поделились первыми инсайтами из масштабного исследования аналитиков, которое они провели в 2024 году. Это рейтинги и списки экспертов отрасли и каналов.

Выборка в исследовании получилась солидная — 1293 человека.

Вот кого опрошенные ребятами аналитики чаще всего отмечали в списке экспертов:
1. Анатолий Карпов
2. Валерий Бабушкин
3. Роман Бунин

А рейтинге каналов самыми известными оказались:
1. karpov.courses
2. Reveal the Data
3. настенька и графики

🔗 Изучить полные рейтинги и списки экспертов из исследования можно по ссылке.

🎄 Команда NEWHR продолжает обрабатывать полные результаты исследования аналитиков: это данные о зарплатах, местах работы, желанных работодателях и многое другое. Обещают выложить в начале 2025 года. Ждем.
2024/12/25 05:17:30
Back to Top
HTML Embed Code: