Однажды, после черной-черной пятницы, когда осенние скидки уже закончились, а новогодние распродажи еще и не думали начинаться, преподаватель курса «Машинное обучение в биологии и биомедицине» получил на проверку вот такое домашнее задание, и был очень... удивлен.
А вы сможете догадаться, что именно так удивило нашего преподавателя?
Спойлер: самые внимательные смогутзаписаться на весенний поток курса «Машинное обучение в биологии и биомедицине» со скидкой 20% , но только до 9 декабря 🙃
#в_openbio_тоже_шутят
А вы сможете догадаться, что именно так удивило нашего преподавателя?
Спойлер: самые внимательные смогут
#в_openbio_тоже_шутят
😁6🔥2🤓2
Media is too big
VIEW IN TELEGRAM
📈 Построение успешной карьеры (и особенно выход на руководящие должности) требует постоянного развития навыков, причем важно уделять внимание не только hard skills, но и soft skills. И сфера биоинформатики — не исключение.
Сегодня мы поделимся с вами фрагментом интервью одного из спикеров курса «Машинное обучение в биологии и биоинформатике» Александра Сарачакова, в котором Александр рассказывает о своем походе к сложным, многоуровневым задачам.
Кстати, у вас еще есть возможность узнать больше про опыт и карьерный трек Александра на новом онлайн-вебинаре из серии «Личный путь в сеньора биоинформатика»!
📌 Встреча состоится уже завтра, 10 декабря, в 19:00 по Мск.
Регистрируйтесь, чтобы получить ссылку-приглашение на вебинар, а вопросы для Александра оставляйте в комментариях к этому посту.
До встречи в прямом эфире!
#openbio_webinar
#openbio_interview
#openbio_expert
Сегодня мы поделимся с вами фрагментом интервью одного из спикеров курса «Машинное обучение в биологии и биоинформатике» Александра Сарачакова, в котором Александр рассказывает о своем походе к сложным, многоуровневым задачам.
Кстати, у вас еще есть возможность узнать больше про опыт и карьерный трек Александра на новом онлайн-вебинаре из серии «Личный путь в сеньора биоинформатика»!
📌 Встреча состоится уже завтра, 10 декабря, в 19:00 по Мск.
Регистрируйтесь, чтобы получить ссылку-приглашение на вебинар, а вопросы для Александра оставляйте в комментариях к этому посту.
До встречи в прямом эфире!
#openbio_webinar
#openbio_interview
#openbio_expert
👍6🔥4⚡3
На нашем канале уже появилось несколько относительно продвинутых материалов по Python и pandas, но что делать, если вы еще вообще не брались за изучение питона или забыли некоторые основные темы?
В этом посте мы собрали несколько бесплатных полезных источников, которые помогут вам подтянуть самые базовые принципы программирования на Python, от теории до практики. С этими знаниями вы легко сориентируетесь в дальнейших темах, которые мы рассмотрим на курсе «Машинное обучение в биологии и биомедицине»!
📚 Python for Data Analysis, Wes McKinney
Учебник по питону от популярного издательства O’Reilly, доступный онлайн в html формате, подробно объясняет принципы работы как Python в целом, так и отдельных библиотек, включая pandas, matplotlib и другие.
Из личного опыта методиста OpenBio: примеры кода и сопровождающие их объяснения в этой книге помоглиоткрыть третий глаз глубоко разобраться в сути отдельных команд и лучше усвоить несколько тем, раньше казавшихся сложными.
📚 Видеоуроки Python на YouTube
Если вам удобнее воспринимать информацию в видео формате, то на помощь придет YouTube. Вот лишь пара примеров каналов, на русском и английском языках, которые содержат подробные разборы методов и библиотек Python и не только.
📚 Документация
Максимально простой в плане доступности, но, возможно, не в плане восприятия, способ ознакомиться с Python и его библиотеками – прочитать официальную документацию, которая хранится в открытом доступе. Хотя в документации можно найти подробнейшее описание любой функции и примеров ее использования, информация может быть представлена в довольно сухом техническом виде, сложном для восприятия.
Плюсом является то, что документация часто содержит так называемые quick start guides для начинающих, которые предлагают вводные уроки и простые примеры. Такие есть, например, для библиотек pandas и matplotlib.
📚 Онлайн сборники упражнений по питону
А если вы уже чувствуете уверенность в своих навыках программирования и рветесь пустить их в ход, обратите внимание на сайты вроде Hackinscience, Practice Python и введение в pandas от LeetCode, которые предлагают упражнения и задачи по питону с разными уровнями сложности. Практика рождает совершенство, поэтому не бойтесь пробовать себя в решениях!
#openbio_python #openbio_pandas #openbio_practice
В этом посте мы собрали несколько бесплатных полезных источников, которые помогут вам подтянуть самые базовые принципы программирования на Python, от теории до практики. С этими знаниями вы легко сориентируетесь в дальнейших темах, которые мы рассмотрим на курсе «Машинное обучение в биологии и биомедицине»!
📚 Python for Data Analysis, Wes McKinney
Учебник по питону от популярного издательства O’Reilly, доступный онлайн в html формате, подробно объясняет принципы работы как Python в целом, так и отдельных библиотек, включая pandas, matplotlib и другие.
Из личного опыта методиста OpenBio: примеры кода и сопровождающие их объяснения в этой книге помогли
📚 Видеоуроки Python на YouTube
Если вам удобнее воспринимать информацию в видео формате, то на помощь придет YouTube. Вот лишь пара примеров каналов, на русском и английском языках, которые содержат подробные разборы методов и библиотек Python и не только.
📚 Документация
Максимально простой в плане доступности, но, возможно, не в плане восприятия, способ ознакомиться с Python и его библиотеками – прочитать официальную документацию, которая хранится в открытом доступе. Хотя в документации можно найти подробнейшее описание любой функции и примеров ее использования, информация может быть представлена в довольно сухом техническом виде, сложном для восприятия.
Плюсом является то, что документация часто содержит так называемые quick start guides для начинающих, которые предлагают вводные уроки и простые примеры. Такие есть, например, для библиотек pandas и matplotlib.
📚 Онлайн сборники упражнений по питону
А если вы уже чувствуете уверенность в своих навыках программирования и рветесь пустить их в ход, обратите внимание на сайты вроде Hackinscience, Practice Python и введение в pandas от LeetCode, которые предлагают упражнения и задачи по питону с разными уровнями сложности. Практика рождает совершенство, поэтому не бойтесь пробовать себя в решениях!
А если обилие источников вызывает у вас вопросы из серии «с чего же мне начать?» или «что теперь со всем этим делать?», то:
приглашаем вас сегодня, 10 декабря в 19:00 по Мск на вебинар с Александром Сарачаковым (Team Leader команды Imaging & Deep learning в BostonGene, преподаватель курса «Машинное обучение в
биологии и биомедицине»).
Александр расскажет про свой опыт построения карьеры в сфере биоинформатики, а также ответит на ваши вопросы!
✍️ Пишите ваши вопросы в комментариях к этому посту, чтобы они точно были озвучены в эфире.
❗️Регистрируйтесь на сайте, и после обязательно подключите нашего чат-бота, чтобы получить ссылку на эфир.
#openbio_python #openbio_pandas #openbio_practice
👍7🔥3🤓2
Статистический анализ в Python📊
В прошлых постах мы познакомились с основами работы с данными в pandas: фильтрацией значений, предварительной обработкой датасетов, группировкой и агрегацией данных.
Мы уже можем замечать интересные распределения или неожиданные закономерности в наших данных, но как подтвердить наши догадки? 🤔 На помощь придет статистический анализ!
Чувствуете в себе силы и желание погрузиться в эту область глубже? Тогда ждем вас на курсе «Машинное обучение в биологии и биомедицине»!
#openbio_python
В прошлых постах мы познакомились с основами работы с данными в pandas: фильтрацией значений, предварительной обработкой датасетов, группировкой и агрегацией данных.
Мы уже можем замечать интересные распределения или неожиданные закономерности в наших данных, но как подтвердить наши догадки? 🤔 На помощь придет статистический анализ!
Чувствуете в себе силы и желание погрузиться в эту область глубже? Тогда ждем вас на курсе «Машинное обучение в биологии и биомедицине»!
#openbio_python
👍5😍2⚡1🤓1
Друзья! Мы разобрали несколько тем по Python и отдельным библиотекам, чтобы вооружиться необходимыми перед стартом курса «Машинное обучение в биологии и биомедицине» от OpenBio знаниями.
Для того, чтобы сделать будущие посты еще более эффективными, нам важна ваша обратная связь.🤝
Поэтому мы предлагаем поделиться вашими впечатлениями о последних материалах по Python с помощью опросов, которые будут ниже👇. А если вам тесно в рамках опроса, ждем ваши вопросы, замечания и наблюдения в комментариях к этому посту!
В благодарность за уделенное время, каждому, кто поделится мнением в опросе или в комментариях, мы пришлем гайд со списком литературы и ресурсов по изучению ML.📕
Всем удачных исследований и хорошей пятницы 😉
#openbio_опрос
Для того, чтобы сделать будущие посты еще более эффективными, нам важна ваша обратная связь.
Поэтому мы предлагаем поделиться вашими впечатлениями о последних материалах по Python с помощью опросов, которые будут ниже👇. А если вам тесно в рамках опроса, ждем ваши вопросы, замечания и наблюдения в комментариях к этому посту!
В благодарность за уделенное время, каждому, кто поделится мнением в опросе или в комментариях, мы пришлем гайд со списком литературы и ресурсов по изучению ML.
Всем удачных исследований и хорошей пятницы 😉
#openbio_опрос
Please open Telegram to view this post
VIEW IN TELEGRAM
edu.openbio.ru
Машинное обучение в биологии и биомедицине
Курсы по машинному обучению в биологии и биомедицине
👍4⚡1🔥1
Насколько понятны материалы по Python, которые сейчас публикуются?
Anonymous Poll
46%
Все понятно, можно усложнить!
29%
Все понятно, в самый раз
4%
Скорее понятно, но есть сложности
14%
Иногда понятно, иногда нет
0%
Скорее непонятно
7%
Ничего не понятно😭
Как вам формат представления материалов?
Anonymous Poll
26%
Текстовые посты лучше
13%
Текст на картинках лучше
26%
Не хватает примеров применений кода
3%
Всегда нужна возможность копировать код из поста
10%
Нужно объяснение более базовых принципов Python (типы переменных и объектов, циклы, функции и т.д.)
3%
Объяснения слишком подробные
3%
Объяснения недостаточно подробные
10%
Все устраивает!
6%
Другое (напишу в комментариях)
Один из частых ответов в опросе выше — пожелание рассказывать больше о применениях кода. Поэтому мы вводим новую рубрику, в рамках которой будем публиковать краткие задания для закрепления теоретических знаний на примерах кейсов с реальными данными.
Сегодня предлагаем вам решить небольшую задачу на закрепление темы статистического анализа в Python, о которой мы писали ранее.
❗️ На курсе «Машинное обучение в биологии и биомедицине» мы работаем с настоящими клиническими данными, что дает ученикам курса возможность опубликовать решенные ими кейсы в портфолио.
Сегодня мы подготовили для вас датасет с клинической направленностью.
🔹 Представьте, что вы организовываете клиническое исследование нового препарата "Новомумаб", который будут выдавать одной когорте пациентов, а пациенты в когорте сравнения будут получать стандартное лечение, "Старомумаб".
🔹 Перед тем, как начать испытание, выборку пациентов тщательно оценивают, чтобы убедиться, что между испытуемыми группами нет значительных различий: изучать влияние внешних воздействий (в данном случае, лекарства) необходимо в максимально однородных условиях, иначе результаты будут недостоверны.
🔹 Вы получили данные о возрастах пациентов в ваших исследуемых группах:
Ответьте на вопросы:
❓ Какой статистический тест нужно использовать, чтобы понять, есть ли разница в возрасте между данными группами?
❓ Посчитайте p-value на основании выбранного вами теста.
Код для правильного решения задачи:
t_stat, p_value = stats.ttest_ind(arm1_ages, arm2_ages)
print("T-test statistic is: ", t_stat, "\nP-value is: ", p_value)
🔤 Ждем ваши ответы в комментариях, авторы правильных ответов получат скидку 15% на обучение на курсе «Машинное обучение в биологии и биомедицине»!
Официальное решение мы опубликуем на следующей неделе.
#openbio_практика
#openbio_python
Сегодня предлагаем вам решить небольшую задачу на закрепление темы статистического анализа в Python, о которой мы писали ранее.
Кстати, уже завтра цены на курс поднимутся! А в течение всего дня вы еще можете присоединиться к курсу по текущей цене. Оставьте заявку на сайте, и с вами свяжется менеджер.
Сегодня мы подготовили для вас датасет с клинической направленностью.
🔹 Представьте, что вы организовываете клиническое исследование нового препарата "Новомумаб", который будут выдавать одной когорте пациентов, а пациенты в когорте сравнения будут получать стандартное лечение, "Старомумаб".
🔹 Перед тем, как начать испытание, выборку пациентов тщательно оценивают, чтобы убедиться, что между испытуемыми группами нет значительных различий: изучать влияние внешних воздействий (в данном случае, лекарства) необходимо в максимально однородных условиях, иначе результаты будут недостоверны.
🔹 Вы получили данные о возрастах пациентов в ваших исследуемых группах:
arm1_ages = [34, 27, 20, 30, 32, 36, 24, 28, 39, 19]
arm2_ages = [32, 39, 32, 48, 39, 38, 33, 42, 40, 38]
Ответьте на вопросы:
Подсказка: используйте наш пост о статистическом анализе в Python, чтобы выбрать правильный тест и написать для него код.
Код для правильного решения задачи:
print("T-test statistic is: ", t_stat, "\nP-value is: ", p_value)
Официальное решение мы опубликуем на следующей неделе.
#openbio_практика
#openbio_python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔1🤓1
Друзья, мы продолжаем цикл онлайн-встреч из серии «Личный путь в сеньора биоинформатика»!
Уже на следующей неделе нас ждет новая встреча: «Карьерный путь биоинформатика: от студента до сеньора» с Анной Фоминой.
🗓 Вебинар состоится 24 декабря в 19:00 по Мск.
Анна — химик, просветитель, выпускница Сколтеха по направлению «Life Sciences», со-основательница проекта о карьере в науке и образовании «Sci_Career», многократная победительница и финалистка премий «За верность науке», ментор и научный коммуникатор.👏
На встрече будут обсуждаться опции трудоустройства в сфере биоинформатики, варианты развития внутри индустрии и науки, а также способы, как попасть в эту сферу из смежных отраслей и что для этого нужно.
Встречаемся 24 декабря, вторник, в 19:00 по Мск.
✍️ Пишите ваши вопросы в комментариях к этому посту, чтобы они точно были озвучены в эфире.
❗️ Регистрируйтесь на сайте, чтобы получить ссылку на эфир.
#openbio_webinar
#openbio_interview
#openbio_expert
Уже на следующей неделе нас ждет новая встреча: «Карьерный путь биоинформатика: от студента до сеньора» с Анной Фоминой.
Анна — химик, просветитель, выпускница Сколтеха по направлению «Life Sciences», со-основательница проекта о карьере в науке и образовании «Sci_Career», многократная победительница и финалистка премий «За верность науке», ментор и научный коммуникатор.
На встрече будут обсуждаться опции трудоустройства в сфере биоинформатики, варианты развития внутри индустрии и науки, а также способы, как попасть в эту сферу из смежных отраслей и что для этого нужно.
Встречаемся 24 декабря, вторник, в 19:00 по Мск.
#openbio_webinar
#openbio_interview
#openbio_expert
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥4😍2
🔹 Принципы работы
Основной процесс построения графиков обеспечивается модулем pyplot в составе библиотеки Matplotlib, который представляет собой сборник интуитивно понятных команд.
Импорт модуля в ваше рабочее пространство:
import matplotlib.pyplot as plt
Вот несколько основных функций, которые часто используются при работе с pyplot:
● plt.plot(): По умолчанию — линейный график.
● plt.bаr(): Столбчатый график.
● plt.hist(): Гистограмма.
● plt.title(): Устанавливает заголовок графика.
● plt.xlabel() и plt.ylabel(): Устанавливают названия осей X и Y.
"Кирпичиками" рисунков в Matplotlib служат фигуры (figure) и оси (axis). Фигура представляет собой всю область, в которой будут строиться графики (один или несколько). Осью называют область, где непосредственно будут отображаться данные для одного графика.
Фигура создается с помощью функции
plt.figure()
. Построим один график:data_x = [5, 10, 15, 20, 25]
data_y = [37, 30, 32, 36, 24]
fig1 = plt.figure(figsize=[6,4]) # Аргумент figsize позволяет менять размер фигуры
fig1.add_subplot()
plt.plot(data_x, data_y)
Создать фигуру с несколькими осями можно двумя способами:
1) Построить сначала фигуру, затем добавлять оси по отдельности:
fig2 = plt.figure()
ax1 = fig2.add_subplot(1, 2, 1)
ax2 = fig2.add_subplot(1, 2, 2)
2) Создать фигуру с заявленным количеством осей одной командой:
fig3, ax = plt.subplots(1, 2)
🔹 “Украшение” графиков
Matplotlib позволяет тонко настраивать графики: менять можно стиль линий, точек, цвета, добавлять аннотации и метки на осях. Это помогает делать визуализации более информативными и привлекательными.
Настройки стиля передаются функциям для построения графиков в виде аргументов. Самые простые из них:
● marker: меняет форму точки (маркера) на графике.
● linestyle: меняет стиль линии с помощью передачи названий стилей – “solid”, “dashed” и др. – или условных обозначений – “-”, “--”, “:” и др.
● color: для самых популярных цветов существуют сокращенные обозначения, например, "r" – красный, "g" – зеленый, "b" – синий.
В общем случае запись функции со стилистическими параметрами выглядит вот так:
plt.plot(data_x, data_y, marker="o", linestyle="dotted", color="g")
🔹 Пример использования
Рассмотрим пример кода, с помощью которого мы создадим несколько графиков в одном рисунке. Это важный инструмент, который пригодится всем, кто готовит отчеты и научные публикации.
import matplotlib.pyplot as plt
import pandas as pd
# Создаем датасет
data = {
'Возраст': [25, 30, 22, 35, 28, 40],
'Диагноз': ['А', 'Б', 'А', 'Б', 'А', 'А'],
'Год заболевания': [2000, 2000, 2001, 2001, 2001, 2001],
'Срок лечения': [10, 16, 12, 20, 14, 8]
}
df = pd.DataFrame(data)
# Создаем фигуру и оси
fig, axs = plt.subplots(1, 3, figsize=(12, 4))
# Линейный график
pts_per_year = df.value_counts('Год заболевания')
axs[0].plot(pts_per_year.index, pts_per_year.values, color='k')
axs[0].set_title('Количество случаев по годам')
axs[0].set_xlabel('Год')
axs[0].set_ylabel('Кол-во пациентов')
# Столбчатый график
diagnosis_df = df.value_counts('Диагноз')
axs[1].bar(diagnosis_df.index, diagnosis_df.values, color=['b', 'g'])
axs[1].set_title('Количество случаев по диагнозу')
axs[1].set_xlabel('Диагноз')
axs[1].set_ylabel('Кол-во пациентов')
# Гистограмма
axs[2].hist(df['Возраст'], bins=5, color='teal')
axs[2].set_title('Распределение по возрасту')
axs[2].set_xlabel('Возраст')
axs[2].set_ylabel('Частота')
plt.tight_layout()
plt.show()
🚀 Надеемся, эти данные помогут вам с исследованиях и в подготовке к курсу "Машинное обучение в биологии и биомедицине". А в следующий раз обсудим другую библиотеку для визуализации Seaborn.
#openbio_python #openbio_pandas #openbio_visualization
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥6👍4🤓3
🔸 Инженер по компьютерному зрению в ООО Медиктур
Компания ООО Медиктур ищет специалиста, который будет заниматься разработкой и оптимизацией моделей для анализа медицинских изображений (МРТ, КТ), разработкой алгоритмов сегментации и классификации и тестированием решений при взаимодействии с врачами. Требуются знания Python, TensorFlow, PyTorch и OpenCV, а также опыт работы с медицинскими данными (DICOM, NIfTI).
🔸 Data scientist в Европейский Медицинский Центр
Мы ищем Data Scientist для анализа данных, сегментации и разработки предиктивных моделей. Требуется высшее образование в области информатики или математики, уверенное владение Python и библиотеками (numpy, pandas, sklearn), знание BI-систем и SQL. Опыт работы 1-2 года в b2c бизнесе обязателен.
🔸 Middle Data Scientist в Акрихин
Акрихин приглашает Middle Data Scientist для разработки ML моделей и Computer Vision. Задачи включают оптимизацию распределения ресурсов, создание AI-ассистентов и исследовательские проекты. Идеальный кандидат имеет 2+ года опыта в Data Science, владеет Python и библиотеками (Pandas, TensorFlow), работает с NLP и SQL. Приветствуется опыт визуализации данных.
🔸 Data Scientist. Сеть клиник НИАРМЕДИК
Специалист должен иметь от 1 года опыта в data science и уверенно владеть Python и библиотеками для анализа данных. Обязанности включают оптимизацию ML-моделей для медицинской документации и совершенствование NLP-систем. Требуется знание математической статистики и алгоритмов, опыт с NLP и фреймворками (Keras, TensorFlow). Реализованные ML проекты в медицине, а также сертификаты профильных онлайн-курсов будут плюсом.
🔸 Младший аналитик данных. Группа компаний МЕДСИ.
Мы разрабатываем экосистему для Медси, включая мобильное приложение SmartMed и MDM-систему. Основное внимание будет уделено обработке текстовых медицинских данных. Необходимо знание Python и основных библиотек для анализа данных (pandas, matplotlib), SQL, Excel и PowerPoint, а также основ математической статистики.
#openbio_вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍3🐳2😍1
Продолжаем знакомиться с методами визуализации данных в Python!
В рамках этого поста рассмотрим библиотеку Seaborn.
Seaborn — библиотека, основанная на Matplotlib, которая легко интегрируется с Pandas и позволяет строить красивые графики одной командой. Она упрощает работу с данными, минимизируя технические детали.
Сегодня мы обсудим уникальные особенности Seaborn и сравним его с Matplotlib.
🔹 Настройка тем
Самый простой способ навести красоту с помощью Seaborn – установить общий стиль для всех графиков (даже если вы строили их другими библиотеками), выбрав одно из готовых решений, что позволяет быстро адаптировать их внешний вид для разных контекстов.
🔹 Статистическая оценка
Многие функции Seaborn автоматически выполняют статистическую оценку и отображают ее результаты на графиках: например, для линейных графиков доступно вычисление и добавление на изображение доверительных интервалов.
Seaborn также позволяет дополнить график более сложными расчетами: так, на диаграммы рассеяния можно добавить модель линейной регрессии с помощью функции
🔹 Представление сложных наборов данных
Некоторые функции Seaborn комбинируют разные типы графиков, чтобы отобразить несколько параметров данных в одном рисунке.
Например, функция
🔹 Группы функций в Seaborn
Функции графиков в Seaborn можно сгруппировать на основе данных, для которых они используются:
● Реляционные функции: отображают взаимосвязи между числовыми переменными.
Примеры:
● Распределительные функции: показывают распределения данных.
Примеры:
● Категориальные функции: сравнивают данные по категориям.
Примеры:
Функции внутри одного модуля имеют общий базовый код и настраиваются схожими наборами аргументов. Это облегчает переключение между способами отображения однотипной информации.
❗️ Параметры, специфичные для функций одного модуля, не отображаются в документации по отдельной функции. Чтобы разобраться со всеми параметрами, настраиваемыми через аргументы, придется покопаться в разных разделах документации Seaborn.
🔹 Связь с Matplotlib
Хотя Seaborn самодостаточен, для более тонкой настройки графиков потребуется подключить к работе Matplotlib. Matplotlib позволяет конфигурировать любой элемент графика, и комбинация функций двух библиотек позволит адаптировать графики под ваши нужды в мельчайших деталях.
Таким образом, Seaborn предоставляет несколько уровней настройки:
● Настройка тем (стилей)
● “Верхнеуровневые” функции, которые позволяют создавать и модифицировать фигуры
● Стандартизированные аргументы внутри групп функций, которые позволяют менять отображение разных типов графиков
● Команды Matplotlib, которые позволяют получить еще больший контроль над изображением.
🔜 Пост получился насыщенным теоретической информацией, но скоро мы отдельно пройдемся по нескольким примерам графиков из Seaborn, поделимся образцами кода, а также опубликуем задачку по материалам недели 😉
#openbio_python #openbio_visualization
💡 Машинное обучение в биологии и биомедицине | OpenBio.Edu
В рамках этого поста рассмотрим библиотеку Seaborn.
Seaborn — библиотека, основанная на Matplotlib, которая легко интегрируется с Pandas и позволяет строить красивые графики одной командой. Она упрощает работу с данными, минимизируя технические детали.
Графики, построенные с помощью Seaborn, часто можно видеть в крутых научных публикациях. Навык строить такие графики точно пригодится для анализа биомедицинских данных, с которыми мы будем работать на курсе “Машинное обучение в биологии и биомедицине”!
Сегодня мы обсудим уникальные особенности Seaborn и сравним его с Matplotlib.
🔹 Настройка тем
Самый простой способ навести красоту с помощью Seaborn – установить общий стиль для всех графиков (даже если вы строили их другими библиотеками), выбрав одно из готовых решений, что позволяет быстро адаптировать их внешний вид для разных контекстов.
🔹 Статистическая оценка
Многие функции Seaborn автоматически выполняют статистическую оценку и отображают ее результаты на графиках: например, для линейных графиков доступно вычисление и добавление на изображение доверительных интервалов.
Seaborn также позволяет дополнить график более сложными расчетами: так, на диаграммы рассеяния можно добавить модель линейной регрессии с помощью функции
lmplot()
.🔹 Представление сложных наборов данных
Некоторые функции Seaborn комбинируют разные типы графиков, чтобы отобразить несколько параметров данных в одном рисунке.
Например, функция
jointplot()
показывает совместное распределение двух числовых переменных и дополняет их распределением каждой переменной в отдельности, сочетая таким образом scatter plot и гистограммы.🔹 Группы функций в Seaborn
Функции графиков в Seaborn можно сгруппировать на основе данных, для которых они используются:
● Реляционные функции: отображают взаимосвязи между числовыми переменными.
Примеры:
scatterplot
, lineplot
.● Распределительные функции: показывают распределения данных.
Примеры:
histplot
, kdeplot
и boxplot
.● Категориальные функции: сравнивают данные по категориям.
Примеры:
barplot
, countplot
и violinplot
.Функции внутри одного модуля имеют общий базовый код и настраиваются схожими наборами аргументов. Это облегчает переключение между способами отображения однотипной информации.
🔹 Связь с Matplotlib
Хотя Seaborn самодостаточен, для более тонкой настройки графиков потребуется подключить к работе Matplotlib. Matplotlib позволяет конфигурировать любой элемент графика, и комбинация функций двух библиотек позволит адаптировать графики под ваши нужды в мельчайших деталях.
Таким образом, Seaborn предоставляет несколько уровней настройки:
● Настройка тем (стилей)
● “Верхнеуровневые” функции, которые позволяют создавать и модифицировать фигуры
● Стандартизированные аргументы внутри групп функций, которые позволяют менять отображение разных типов графиков
● Команды Matplotlib, которые позволяют получить еще больший контроль над изображением.
#openbio_python #openbio_visualization
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥6👍2🤔1
Друзья, недавно мы просили вас поделиться мнением о сложности и форматах контента в канале.
❤️ Команда проекта благодарит всех, кто уделил время и проголосовал в опросе, и дарит вам гайд с бесплатными материалами по изучению ML, который поможет подготовиться к курсу «Машинное обучение в биологии и биомедицине».
Также админы канала получили несколько запросов о публикации этого гайда в открытом доступе, и вот сегодня, когда нас уже более 500 человек, мы решили опубликовать гайд для всех!
Благодарим вас за то, что вы с нами, и рады быть вашим проводником в мир ML в биологии и биомедицине!
🎁 Забрать гайд
PS высказать свое мнение о контенте, если вы еще не, можно в этом посте.
#openbio_дарит_подарки
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu
Также админы канала получили несколько запросов о публикации этого гайда в открытом доступе, и вот сегодня, когда нас уже более 500 человек, мы решили опубликовать гайд для всех!
Благодарим вас за то, что вы с нами, и рады быть вашим проводником в мир ML в биологии и биомедицине!
PS высказать свое мнение о контенте, если вы еще не, можно в этом посте.
#openbio_дарит_подарки
Please open Telegram to view this post
VIEW IN TELEGRAM
😍4👍3🔥3