- Telegram Web

Статистика и R в науке и аналитике

Человек наук – это канал о красоте окружающего мира глазами учёного. Ведет его Вова, крутой биоинформатик, сейчас делает PhD в Мюнхене, связанное с машинным обучением и single-cell.

Здесь вы узнаете:

🍣 Математика программ лояльности: как надолго привязать голодных студентов к доставке роллов, чтобы они ещё и остались довольны

👾 Смешные и страшные истории из мира науки, а также шокирующая обыденность жизни учёных

📊 Как стоит и не стоит визуализировать данные

✉️ А также авторское исследование о том, как лучше писать письма для стажировок или PhD и
советы со стороны собеседующих, будет актуально для науки и не только.

Подписывайтесь!

человек наук

Красота окружающего мира глазами учёного. По всем вопросам пишите @science_boy

4.6K views12:40

Статистика и R в науке и аналитике

Итоги года 🎉🌲🌲🌲

TGstat приготовили красивую открытку с итогами года, приятно увидеть в одном месте значимые метрики) На канале уже больше 3000 человек, что очень радует и мотивирует продолжать развивать канал и готовить новые материалы.

От себя добавлю еще проекты, которые хотелось бы отметить как значимые в 2024 году.

📱 Выпустила ряд видео, посвященных статистике и R, с плейлистом можно ознакомиться по ссылке.

🌱 Провели совместно с каналом чтопосеешь.org курс по статистике для селекционеров.

🖥 Совместно с Бластим подготовили курс по tidyverse на stepik, а также провели два потока курса по R и статистике. Рассматриваю в дальнейшем продолжение формата курса на stepik, с увеличением количества материалов и сложности заданий, и рассчитываю продолжать сотрудничество как учебный ассистент на курсе по R.

😎 Написала как биологу вкатиться в аналитику данных.

📊 А также подготовила большой разбор про сравнение теста Велча с тестом Стьюдента.

Планы по развитию канала: продолжать разбирать простые и сложные концепты в статистике, применительно к науке и аналитике данных, и постараюсь вернуться к лекциям на ютуб или степик.

Поздравляю всех с наступающим новым годом, желаю достижения всех целей в профессиональном и личном плане! 🎉
Чтобы p-value было меньше 0.05, эксперименты удавались, и данные всегда были качественными и полными 💪

Увидимся в следующем году!

Please open Telegram to view this post

VIEW IN TELEGRAM

5.3K viewsedited 09:00

Статистика и R в науке и аналитике

Что такое продуктовая аналитика?

Хочу похвастаться — чуть больше двух месяцев работаю продуктовым аналитиком в Литрес 📚, в команде монетизации, поэтому решила написать впечатления о работе и вообще о том, что такое и зачем нужна продуктовая аналитика.

Впечатления о работе продуктовым аналитиком в Литрес

…если нужно описать одной картинкой ⬆️

А если серьезно, у меня классический стек продуктового аналитика: дизайн и проведение A/B тестов (в основном через вариокуб, иногда вручную подвожу итоги), генерация продуктовых гипотез, написание ETL-процессов (airflow, python) и создание дашбордов (Superset).

Немного о том, чем занимаются продуктовые аналитики в моем понимании.
Я бы описала многообразие работы продуктовым аналитиком так: аналитик помогает бизнесу принять взвешенные решения, основываясь на данных. Это может включать:

- Анализ поведения пользователей на основе логов приложения для выявления наиболее популярных функций и проблемных мест.
- Дизайн и проведение A/B тестов для улучшения пользовательского опыта и увеличения монетизации приложения.
A/B тесты позволяют статистически сравнить эффект какого-либо воздействия в продукте, это очень похоже на обычные эксперименты сравнения с контролем, которые используются в науке (методика A/B тестирований и пришла из научных исследований). Простое объяснение про A/B можно посмотреть в посте Юры, также я выкладывала пример дизайна A/B теста в соревновании от Samokat.tech.
В целом методика тестирований это обширная тема, на много курсов и телеграм-каналов, но в двух словах так.
- Создание дашбордов для наглядного представления информации и отслеживания ключевых метрик продукта.
- И самое интересное - генерация гипотез, что можно улучшить в продукте, далее разработчики могут реализовать это изменение, а аналитики проверяют результат с помощью A/B тестов.

Не все из перечисленного является уникальной способностью продуктового аналитика, например дашборды делают BI-аналитики, и в принципе любые аналитики, гипотезы могут придумывать продакт-менеджеры, анализируют поведение пользователей маркетологи и UX-исследователи. Несмотря на это, продуктовые аналитики играют ключевую роль в интеграции и интерпретации данных для принятия решений бизнеса.
Именно это для меня кажется самым интересным в работе продуктовым аналитиком 😎

#product #analytics

Please open Telegram to view this post

VIEW IN TELEGRAM

5.8K views05:00

Статистика и R в науке и аналитике

Долгожданный разбор курса “Основы статистики” на степике

Итак, это свершилось, я наконец-то дописала разбор и опубликовала его здесь

https://ubogoeva.github.io/R4Analytics/posts/review_of_statistics_course.html

Немного контекста: в качестве вводного курса по статистике часто рекомендуют курс “Основы статистики” Анатолия Карпова на степике. Однако многие считают, что курс устарел и содержит много неточностей и ошибок, и я решила подробно разобрать, какие именно.
Постаралась следовать формату “критикуешь - предлагай” и самостоятельно раскрыть темы, которые были недостаточно объяснены в курсе, дополнив их источниками для дальнейшего изучения.

В конце разбора предлагаю свой список рекомендованных источников для изучения статистики на любой уровень подготовки.

В вычитке и корректировке формулировок финальной версии мне очень помог крутой статистик Матвей Славенко (рекомендую подписаться на его канал душно про дату).

#base_stat #stats

ubogoeva.github.io

R4Analytics - Разбор курса ‘Основы статистики’

11.0K views06:10

Статистика и R в науке и аналитике

Институт биоинформатики запускает серию открытых лекций «Разрушители статистических мифов»
12, 19 и 26 марта в 19:00 МСК, онлайн

Преподаватели трека по биостатистике Института биоинформатики подготовили для вас серию лекций, которые разрушат самые популярные статистические мифы.
Почему нельзя пользоваться простыми алгоритмами для выбора статистического теста? Что же такое p-value, и чем оно не является? Нужно ли проводить проверку на нормальность, или это ничего не изменит? Эти, а также другие вопросы, вызывающие бурные споры как у новичков, так и у мастодонтов, мы обсудим на лектории!

🦖

12 марта, 19:00 МСК | Евгений Бакин
Миф №1: Статистика – наука точная, и в ней нет места мифам

🦖

19 марта, 19:00 МСК | Ольга Мироненко
Миф №2: Доверительные интервалы и р-значения – это то, чем они кажутся

🦖

26 марта, 19:00 МСК | Матвей Славенко
Миф №3: Ненормальное распределение требует ненормальных решений

Регистрация открыта до 26 марта 17:00 МСК: bioinf.me/stat_myths (если вы не получили письмо после регистрации – проверьте, пожалуйста, спам)

Это первая часть из серии лекций, посвященной статистическим мифам, и во второй части я тоже буду рассказывать про один из мифов, но детали анонсируем позже, так что stay tuned 🔔

До встречи!

P.S.: Слушатели лектория больше никогда не будут ошибаться в вопросах статистики! Или будут. Всё как с динозаврами – 50/50!

Please open Telegram to view this post

VIEW IN TELEGRAM

8.3K views07:00

Статистика и R в науке и аналитике

NEWHR выпустили результаты исследования рынка аналитиков за 2024 год

Я репостила анонс исследования NEWHR, спасибо всем, кто прошел опрос, удалось набрать довольно солидную выборку, 1293 человека 🔥

Смотреть полные результаты

Основные инсайты из исследования:

👉 Главные выводы

👉 Какие задачи решают аналитики

👉 ЗАРПЛАТЫ: как менялись за год и сколько получают аналитики, существует ли гендерное неравенство в зарплатах (спойлер: существует) + NEWHR дополнили исследование своей экспертизой: что повышает или снижает стоимость аналитиков

👉 Откуда пришли в профессию и куда идут дальше

👉 ТОП и Анти-ТОП компаний для аналитиков

👉 Каких экспертов котируют и за кем следят

Для меня наиболее интересным оказались результаты по зарплате аналитиков, их гендерному распределению, а также топ и анти-топ компаний для аналитиков (забавно, например, что яндекс ❤️ попал и туда и туда).

Еще хочу отметить исследование как пример очень хорошей визуализации данных (хотя по мелочи есть к чему придраться, например в самом первом графике цвет избыточен, на мой взгляд).

В основном в выборке представлены дата- и продуктовые аналитики, и дата-аналитиков было почти столько же, сколько всего респондентов в аналогичном исследовании 2023 года.

Спасибо NEWHR за проведение таких исследований, и всем, кто прошел опрос, это очень полезно, чтобы понимать рынок труда и свое место в нем.

Please open Telegram to view this post

VIEW IN TELEGRAM

Статистика и R в науке и аналитике

Исследование рынка аналитиков 📊

NEWHR проводит очередное исследование рынка аналитики, и меня пригласили распространить опрос как эксперта. Это очень круто, что подобные исследования проводятся, так как повышают прозрачность рынка, дают большее понимание…

5.3K views07:00

Статистика и R в науке и аналитике

История A/B тестирования: от лечения цинги до цвета ссылок Google

Сегодня разберем историю A/B тестов — от первых экспериментов в медицине до современных бизнес-кейсов. Материал получился объемнее, чем изначально планировался, поэтому вынесла отдельно:

https://ubogoeva.github.io/R4Analytics/posts/history_of_AB_testing.html

В следующих постах разберем больше про первые A/B тесты в Amazon, Microsoft и других бигтехах.

Пишите в комментариях, что уже знали и что оказалось новым!

#stats #AB_tests #analytics

ubogoeva.github.io

R4Analytics - История A/B тестирования: от лечения цинги до цвета ссылок Google

6.8K viewsedited 08:02

Статистика и R в науке и аналитике

Ну как там с нормальным распределением для t-теста?

Уже завтра, 10 апреля в 19:00 МСК, будет долгожданная лекция про ненужность нормального распределения от лектория «Разрушители статистических мифов»!

🦖Миф №3: Ненормальное распределение требует ненормальных решений | Матвей Славенко
На встрече мы поговорим про то, откуда взялись проверки на нормальность, что с ними не так и что делать, если не проверять на нормальность.

Регистрация по ссылке, и еще я закину в комменты непосредственно перед началом ссылку на трансляцию.
Запись будет опубликована на сайте.

🔥 Эксклюзивный контент для моих подписчиков: администрация секретно ознакомилась с черновиками лекции, прикрепляю несколько слайдов оттуда и бонусные мемы. Приходите на лекцию онлайн, чтобы иметь возможность задавать вопросы, но запись тоже будет.

P.S. ААААААА наконец-то Матвей выпустит лекцию, с прошлого лета ждем! Дождались, ура!)))

4.9K views06:02

Статистика и R в науке и аналитике

Как вкатиться в продуктовую аналитику с научным бэкграундом?
Насколько важна сильная база в статистике?

На эти и другие вопросы отвечу на стриме с Юрой Борзило, он крутой продуктовый аналитик в Альфа банке, автор канала про A/B тесты и продуктовую аналитику: https://www.tgoop.com/y_borzilo

Напомню, что я раньше работала биоинформатиком в лаборатории, изучала генные сети фитогормонов растений. Теперь перекатилась в продуктовую аналитику в Литрес, провожу A/B тесты и исследования.

На стриме поговорим:
1. Что такое "Анализ генных сетей фитогормонов растений"?
2. Почему решила уйти из науки в в аналитику?
3. Что было самое сложное при поиске первой работы аналитиком?
4. В чем отличие использования статистики в науке и в аналитике?
5. Почему всем нужен реальный опыт A/B тестов даже если хорошо знаешь статистику?
6. Действительно ли надо упарываться рядовому аналитику в статистику или хватит какой-то базы?

Стрим состоится 16 апреля, в 19.00 МСК.
Ссылки на трансляцию пришлю в день проведения стрима, а также обновлю в этом посте:
а вот и она https://us06web.zoom.us/j/82861386388?pwd=gguHOFCxOwAQT5MzNK4t2aSaz98bDK.1, запись будет отдельно

Пишите вопросы в комментариях или во время стрима!

4.9K viewsedited 08:34

Статистика и R в науке и аналитике

Как вкатиться в продуктовую аналитику с научным бэкграундом? Насколько важна сильная база в статистике? На эти и другие вопросы отвечу на стриме с Юрой Борзило, он крутой продуктовый аналитик в Альфа банке, автор канала про A/B тесты и продуктовую аналитику:…

А вот и запись стрима
https://youtu.be/gqbuCF8B4Cg

YouTube

Из науки в продуктовую аналитику. Стрим Юрия Борзило и Елены Убогоевой.

На стриме поговорим:
1. Что такое "Анализ генных сетей фитогормонов растений"?
2. Почему решила уйти из науки в в аналитику?
3. Что было самое сложное при поиске первой работы аналитиком?
4. В чем отличие использования статистики в науке и в аналитике?
5.…

4.7K viewsedited 15:59

Статистика и R в науке и аналитике

История A/B тестирования: первые тесты в бигтехе

Продолжаем разбирать историю A/B тестов — начало в этом посте.

Сегодня рассмотрим первопроходцев A/B в современном понимании. Точно сказать, какой именно тест был самым первым, нельзя, но ранние примеры приходятся на начало 2000-х:

📱

Amazon:
Amazon позиционирует себя как data-driven компания, где тестируют самые минимальные изменения интерфейса. Уже в 2004 году Рон Кохави представил доклад об их тестах.
Грег Линден предложил показывать персональные рекомендации на этапе чекаута ("Похожие товары" перед оплатой). Старший вице-президент по маркетингу был категорически против, опасаясь, что это отвлечет пользователей от покупки и снизит продажи.
Однако Линден все равно запустил A/B тест, в котором вариант с рекомендациями победил с таким отрывом, что отказ от этой идеи стоил бы Amazon миллионы долларов.

🔍

Google:
Первый A/B тест провели в начале 2000х годов. UX-исследования показывали, что пользователи хотят видеть больше результатов поиска на странице: 20 лучше чем 10, 25 ещё лучше, 30 — идеально. Google провел A/B тест: в экспериментальной группе пользователям показывали 30 результатов поиска на одной странице.
Трафик в экспериментальной группе упал на 25% менее чем за шесть недель. Сотрудники задумались, почему это произошло. Одним из вариантов был парадокс выбора, когда пользователи из-за слишком большого количества вариантов не могут решить, что им выбрать.
Однако разгадка оказалась проста: скорость. Страницы с 30 результатами грузились дольше в среднем на 0.5 секунды, и этого оказалось достаточно, чтобы серьезно ухудшить пользовательский опыт, что повлекло за собой падение трафика и выручки. В результате Google остановился на 10 результатах поиска в выдаче, и это число используется до сих пор.

📱

Bing:
Сотрудник Bing предложил удлинить заголовки рекламы, добавив к ним первую строчку описания: группа A — короткий заголовок (Купить iPhone), группа B — длинный (Купить iPhone 5 с гарантией и доставкой). Идея казалась незначительной и полгода пылилась в бэклоге (очереди задач разработки), пока разработчик не решил её протестировать. Через несколько часов после старта теста сработал "revenue-too-high alert" — новый формат оказался "слишком хорош", подняв выручку на невероятные 12%. Это принесло Bing более $100M годового дохода в США, не ухудшив UX-метрики. Тест многократно повторяли, подтверждая результат (HBR, 2017).

📱

Netflix:
Тестировали обложки фильмов: группа A — стандартные постеры, группа B — персонализированные. Например, для фильма "Умница Уилл Хантинг" любителям романтики показывали кадры с Мэттом Дэймоном и Минни Драйвер, а фанатам комедий — с Робином Уильямсом, известным комиком. A/B тест показал, что персонализированные обложки значительно увеличили вовлечённость и персонализация стала стандартом Netflix (Netflix Tech Blog, 2017).

А вы замечали, что попали в A/B тест? Я недавно заметила, что я не попала в тестовую группу, когда у коллег изменился интерфейс гугл мита, а у меня нет. Однако примерно через неделю это изменение интерфейса доехало и до меня.

#AB_tests #analytics

Please open Telegram to view this post

VIEW IN TELEGRAM

Статистика и R в науке и аналитике

История A/B тестирования: от лечения цинги до цвета ссылок Google

Сегодня разберем историю A/B тестов — от первых экспериментов в медицине до современных бизнес-кейсов. Материал получился объемнее, чем изначально планировался, поэтому вынесла отдельно:
…

4.6K views12:00

Статистика и R в науке и аналитике

Сегодня обсудим, что означают усы на боксплоте, картинка для иллюстрации к опросу ниже

3.2K views06:20

Статистика и R в науке и аналитике

Что отражают усы (whiskers) на графике box-plot?

Final Results

Стандартное отклонение (sd)

Стандартную ошибку (se)

Доверительный интервал (CI)

Верхний и нижний квартили (Q1, Q3)

Межквартильный размах (IQR)

30%

Наблюдаемые максимальные и минимальные значения от соответствующего квартиля в пределах 1.5 IQR

Нет однозначного ответа

Не знаю

936 voters3.6K views06:21

Статистика и R в науке и аналитике

Второй сезон лектория разрушителей статистический мифов открыт 🔥

13 мая, 19:00 МСК | Артемий Охотин

🦖

Миф №5: Рандомизация – смешать и не взбалтывать

На лекции мы обсудим, зачем нужна рандомизация, работает ли она на малых выборках, может ли она не получиться, и как правильно ее проводить!

Запись лекции будет опубликована на сайте: bioinf.me/stat_myths

В связи с праздниками пропустила первую лекцию второго сезона, ее можно посмотреть на сайте лектория:

🦖

Миф №4: Категорически категорично, или «просто разбей на группы» | Алексей Глазков

И еще через неделю будет моя лекция по визуализации данных, где в том числе разберем, как правильно интерпретировать боксплоты 😁, запись будет доступна, но по возможности приходите онлайн

20 мая, 19:00 МСК | Елена Убогоева

🦖

Миф №6: Визуализация – это просто красивые графики

Регистрация открыта до 20 мая 17:00 МСК: bioinf.me/stat_myths

До встречи!

Please open Telegram to view this post

VIEW IN TELEGRAM

4.8K views11:10

Статистика и R в науке и аналитике

Please open Telegram to view this post

VIEW IN TELEGRAM

4.7K viewsedited 12:40

Статистика и R в науке и аналитике

Как я перепутала средние чеки и ARPPU и заруинила несколько A/B тестов

Я работаю в команде платежей, поэтому основные A/B тесты у нас проводятся на последнем этапе воронки - от нажатия кнопки “Купить” до успешной оплаты. Мы используем конверсию в успешную оплату как ключевую метрику и ARPPU как вспомогательную, это достаточно стандартный подход.

Иногда бывает, что одна из метрик падает, а другая растет. Чтобы понять, что на самом деле происходит с выручкой, мы используем прогнозную финмодель. Мой коллега Рома читал про это очень крутой доклад на Aha-25 (ссылка вот, попозже я может напишу развернутый отзыв на конфу).

Небольшая сноска про термины 🤓:
Средний чек (Average Order Value, AOV) - это просто вся выручка, деленная на количество транзакций, то есть буквально среднеарифметическое.
ARPPU (Average Revenue Per Paying User) - средняя выручка на платящего пользователя.
Пример: пользователь 1 купил на 200р, пользователь 2 купил на 100р, потом еще на 300р. Тогда средний чек будет (200+100+300)/3=200, а ARPPU = (200 + (100+300))/2 = 300, так как платящих пользователей 2 в этом примере.
Есть еще метрика ARPU - Average Revenue Per User, средняя выручка на пользователя (включая тех, кто не заплатил).

ARPPU будет всегда больше чем средний чек, как минимум не меньше.
В контексте A/B тестов эти метрики считаются базовыми и разбираются на любом курсе.

Моя ошибка была в том, что я считала средние чеки (просто mean(revenue)), но почему-то думала что это уже ARPPU, таким образом проанализировала несколько результатов тестов. Ошибку случайно заметил продакт, когда сверял исторические данные и увидел, что мои значения "ARPPU" по порядку величины подозрительно похожи на средние чеки 🤦‍♀️. Пришлось пересчитывать, благо принципиально выводы не поменялись, но несколько тестов были признаны неуспешными, а после пересчета оказалось, что все нормально.

Почему используется именно ARPPU как метрика в A/B тестировании?

В принципе, можно использовать разные денежные метрики в зависимости от поставленной задачи. В нашем случае мы рассматриваем ARPPU в связке с конверсией. Используя финмодель, эта связка помогает принимать решения не “на глазок”, а с прогнозом реальной выручки. Но только если метрики посчитаны правильно — теперь я это точно не забуду 🙃

#analytics #AB_tests

Закрытый клуб маркетинговой и продуктовой аналитики. Доклады и конференции в мире MarTech и Продуктовой аналитики.

Matemarketing Education

Образовательная платформа

3.5K views12:02

Статистика и R в науке и аналитике

Please open Telegram to view this post

VIEW IN TELEGRAM

1.5K views07:31

Статистика и R в науке и аналитике

Я обычно не фанат хайпа вокруг ML (линейные регрессии и t-test наше все 😏), но ребята из @blastim сделали настолько крутой курс по ML в биоинформатике на питоне, что я заценила программу даже при всей любви к R. Курс стартует уже завтра, 8 июля, еще можно присоединиться!

📌 Актуальные темы суперпонятным языком: лосс, бэкпроп, диффузия, аттеншн, эмбеддинги (если не все слова знакомы, это нормально, я тоже не все поняла 😁)
📌 Много биоинформатики: анализ биомедицинских данных, разбор популярных ИИ-моделей (Evo2, C2S Scale, AlphaFold), работа с API NCBI, Ensembl, PDB
📌 Реальные инструменты: деплой моделей в Telegram-бота и создание своих ИИ-агентов

8 июля – 30 августа | Онлайн | Преподаватели-ученые (среди них классный спец, Вова Шитов)

Что на выходе:
· Готовый проект для портфолио на GitHub
· Навыки от pandas до нейросетей + создание ИИ-агентов
· Диплом гособразца о повышении квалификации

❗️ Курс подойдёт, если вы уже знакомы с базовым Python. Если сомневаетесь — есть бесплатный входной тест.

Формат:
Вт/Чт 19:00–21:00
Сб 10:00–14:00 по Мск
🔗 Подробнее и регистрация: https://agency.blastim.ru/pythonandml

По промокоду MLSUMMER25 будет 10% скидка, также доступны скидки студентам и аспирантам. Акции можно комбинировать, пишите @varvara_blastim

Приведите друга — получите по 10% скидки каждому

agency.blastim.ru

Курс от Бластим: «Машинное обучение на Python для решения биоинформатических задач»

Без “воды”, с чётким разбором алгоритмов, биологическими примерами и живыми встречами 3 раза в неделю. Официальное удостоверение о повышении квалификации.

957 views16:30

2025/07/08 01:43:47
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>