Как вам формат представления материалов?
Anonymous Poll
26%
Текстовые посты лучше
13%
Текст на картинках лучше
26%
Не хватает примеров применений кода
3%
Всегда нужна возможность копировать код из поста
10%
Нужно объяснение более базовых принципов Python (типы переменных и объектов, циклы, функции и т.д.)
3%
Объяснения слишком подробные
3%
Объяснения недостаточно подробные
10%
Все устраивает!
6%
Другое (напишу в комментариях)
Один из частых ответов в опросе выше — пожелание рассказывать больше о применениях кода. Поэтому мы вводим новую рубрику, в рамках которой будем публиковать краткие задания для закрепления теоретических знаний на примерах кейсов с реальными данными.
Сегодня предлагаем вам решить небольшую задачу на закрепление темы статистического анализа в Python, о которой мы писали ранее.
❗️ На курсе «Машинное обучение в биологии и биомедицине» мы работаем с настоящими клиническими данными, что дает ученикам курса возможность опубликовать решенные ими кейсы в портфолио.
Сегодня мы подготовили для вас датасет с клинической направленностью.
🔹 Представьте, что вы организовываете клиническое исследование нового препарата "Новомумаб", который будут выдавать одной когорте пациентов, а пациенты в когорте сравнения будут получать стандартное лечение, "Старомумаб".
🔹 Перед тем, как начать испытание, выборку пациентов тщательно оценивают, чтобы убедиться, что между испытуемыми группами нет значительных различий: изучать влияние внешних воздействий (в данном случае, лекарства) необходимо в максимально однородных условиях, иначе результаты будут недостоверны.
🔹 Вы получили данные о возрастах пациентов в ваших исследуемых группах:
Ответьте на вопросы:
❓ Какой статистический тест нужно использовать, чтобы понять, есть ли разница в возрасте между данными группами?
❓ Посчитайте p-value на основании выбранного вами теста.
Код для правильного решения задачи:
t_stat, p_value = stats.ttest_ind(arm1_ages, arm2_ages)
print("T-test statistic is: ", t_stat, "\nP-value is: ", p_value)
🔤 Ждем ваши ответы в комментариях, авторы правильных ответов получат скидку 15% на обучение на курсе «Машинное обучение в биологии и биомедицине»!
Официальное решение мы опубликуем на следующей неделе.
#openbio_практика
#openbio_python
Сегодня предлагаем вам решить небольшую задачу на закрепление темы статистического анализа в Python, о которой мы писали ранее.
Кстати, уже завтра цены на курс поднимутся! А в течение всего дня вы еще можете присоединиться к курсу по текущей цене. Оставьте заявку на сайте, и с вами свяжется менеджер.
Сегодня мы подготовили для вас датасет с клинической направленностью.
🔹 Представьте, что вы организовываете клиническое исследование нового препарата "Новомумаб", который будут выдавать одной когорте пациентов, а пациенты в когорте сравнения будут получать стандартное лечение, "Старомумаб".
🔹 Перед тем, как начать испытание, выборку пациентов тщательно оценивают, чтобы убедиться, что между испытуемыми группами нет значительных различий: изучать влияние внешних воздействий (в данном случае, лекарства) необходимо в максимально однородных условиях, иначе результаты будут недостоверны.
🔹 Вы получили данные о возрастах пациентов в ваших исследуемых группах:
arm1_ages = [34, 27, 20, 30, 32, 36, 24, 28, 39, 19]
arm2_ages = [32, 39, 32, 48, 39, 38, 33, 42, 40, 38]
Ответьте на вопросы:
Подсказка: используйте наш пост о статистическом анализе в Python, чтобы выбрать правильный тест и написать для него код.
Код для правильного решения задачи:
print("T-test statistic is: ", t_stat, "\nP-value is: ", p_value)
Официальное решение мы опубликуем на следующей неделе.
#openbio_практика
#openbio_python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤔1🤓1
Друзья, мы продолжаем цикл онлайн-встреч из серии «Личный путь в сеньора биоинформатика»!
Уже на следующей неделе нас ждет новая встреча: «Карьерный путь биоинформатика: от студента до сеньора» с Анной Фоминой.
🗓 Вебинар состоится 24 декабря в 19:00 по Мск.
Анна — химик, просветитель, выпускница Сколтеха по направлению «Life Sciences», со-основательница проекта о карьере в науке и образовании «Sci_Career», многократная победительница и финалистка премий «За верность науке», ментор и научный коммуникатор.👏
На встрече будут обсуждаться опции трудоустройства в сфере биоинформатики, варианты развития внутри индустрии и науки, а также способы, как попасть в эту сферу из смежных отраслей и что для этого нужно.
Встречаемся 24 декабря, вторник, в 19:00 по Мск.
✍️ Пишите ваши вопросы в комментариях к этому посту, чтобы они точно были озвучены в эфире.
❗️ Регистрируйтесь на сайте, чтобы получить ссылку на эфир.
#openbio_webinar
#openbio_interview
#openbio_expert
Уже на следующей неделе нас ждет новая встреча: «Карьерный путь биоинформатика: от студента до сеньора» с Анной Фоминой.
Анна — химик, просветитель, выпускница Сколтеха по направлению «Life Sciences», со-основательница проекта о карьере в науке и образовании «Sci_Career», многократная победительница и финалистка премий «За верность науке», ментор и научный коммуникатор.
На встрече будут обсуждаться опции трудоустройства в сфере биоинформатики, варианты развития внутри индустрии и науки, а также способы, как попасть в эту сферу из смежных отраслей и что для этого нужно.
Встречаемся 24 декабря, вторник, в 19:00 по Мск.
#openbio_webinar
#openbio_interview
#openbio_expert
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥4😍2
🔹 Принципы работы
Основной процесс построения графиков обеспечивается модулем pyplot в составе библиотеки Matplotlib, который представляет собой сборник интуитивно понятных команд.
Импорт модуля в ваше рабочее пространство:
import matplotlib.pyplot as plt
Вот несколько основных функций, которые часто используются при работе с pyplot:
● plt.plot(): По умолчанию — линейный график.
● plt.bаr(): Столбчатый график.
● plt.hist(): Гистограмма.
● plt.title(): Устанавливает заголовок графика.
● plt.xlabel() и plt.ylabel(): Устанавливают названия осей X и Y.
"Кирпичиками" рисунков в Matplotlib служат фигуры (figure) и оси (axis). Фигура представляет собой всю область, в которой будут строиться графики (один или несколько). Осью называют область, где непосредственно будут отображаться данные для одного графика.
Фигура создается с помощью функции
plt.figure()
. Построим один график:data_x = [5, 10, 15, 20, 25]
data_y = [37, 30, 32, 36, 24]
fig1 = plt.figure(figsize=[6,4]) # Аргумент figsize позволяет менять размер фигуры
fig1.add_subplot()
plt.plot(data_x, data_y)
Создать фигуру с несколькими осями можно двумя способами:
1) Построить сначала фигуру, затем добавлять оси по отдельности:
fig2 = plt.figure()
ax1 = fig2.add_subplot(1, 2, 1)
ax2 = fig2.add_subplot(1, 2, 2)
2) Создать фигуру с заявленным количеством осей одной командой:
fig3, ax = plt.subplots(1, 2)
🔹 “Украшение” графиков
Matplotlib позволяет тонко настраивать графики: менять можно стиль линий, точек, цвета, добавлять аннотации и метки на осях. Это помогает делать визуализации более информативными и привлекательными.
Настройки стиля передаются функциям для построения графиков в виде аргументов. Самые простые из них:
● marker: меняет форму точки (маркера) на графике.
● linestyle: меняет стиль линии с помощью передачи названий стилей – “solid”, “dashed” и др. – или условных обозначений – “-”, “--”, “:” и др.
● color: для самых популярных цветов существуют сокращенные обозначения, например, "r" – красный, "g" – зеленый, "b" – синий.
В общем случае запись функции со стилистическими параметрами выглядит вот так:
plt.plot(data_x, data_y, marker="o", linestyle="dotted", color="g")
🔹 Пример использования
Рассмотрим пример кода, с помощью которого мы создадим несколько графиков в одном рисунке. Это важный инструмент, который пригодится всем, кто готовит отчеты и научные публикации.
import matplotlib.pyplot as plt
import pandas as pd
# Создаем датасет
data = {
'Возраст': [25, 30, 22, 35, 28, 40],
'Диагноз': ['А', 'Б', 'А', 'Б', 'А', 'А'],
'Год заболевания': [2000, 2000, 2001, 2001, 2001, 2001],
'Срок лечения': [10, 16, 12, 20, 14, 8]
}
df = pd.DataFrame(data)
# Создаем фигуру и оси
fig, axs = plt.subplots(1, 3, figsize=(12, 4))
# Линейный график
pts_per_year = df.value_counts('Год заболевания')
axs[0].plot(pts_per_year.index, pts_per_year.values, color='k')
axs[0].set_title('Количество случаев по годам')
axs[0].set_xlabel('Год')
axs[0].set_ylabel('Кол-во пациентов')
# Столбчатый график
diagnosis_df = df.value_counts('Диагноз')
axs[1].bar(diagnosis_df.index, diagnosis_df.values, color=['b', 'g'])
axs[1].set_title('Количество случаев по диагнозу')
axs[1].set_xlabel('Диагноз')
axs[1].set_ylabel('Кол-во пациентов')
# Гистограмма
axs[2].hist(df['Возраст'], bins=5, color='teal')
axs[2].set_title('Распределение по возрасту')
axs[2].set_xlabel('Возраст')
axs[2].set_ylabel('Частота')
plt.tight_layout()
plt.show()
🚀 Надеемся, эти данные помогут вам с исследованиях и в подготовке к курсу "Машинное обучение в биологии и биомедицине". А в следующий раз обсудим другую библиотеку для визуализации Seaborn.
#openbio_python #openbio_pandas #openbio_visualization
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥6👍4🤓3
🔸 Инженер по компьютерному зрению в ООО Медиктур
Компания ООО Медиктур ищет специалиста, который будет заниматься разработкой и оптимизацией моделей для анализа медицинских изображений (МРТ, КТ), разработкой алгоритмов сегментации и классификации и тестированием решений при взаимодействии с врачами. Требуются знания Python, TensorFlow, PyTorch и OpenCV, а также опыт работы с медицинскими данными (DICOM, NIfTI).
🔸 Data scientist в Европейский Медицинский Центр
Мы ищем Data Scientist для анализа данных, сегментации и разработки предиктивных моделей. Требуется высшее образование в области информатики или математики, уверенное владение Python и библиотеками (numpy, pandas, sklearn), знание BI-систем и SQL. Опыт работы 1-2 года в b2c бизнесе обязателен.
🔸 Middle Data Scientist в Акрихин
Акрихин приглашает Middle Data Scientist для разработки ML моделей и Computer Vision. Задачи включают оптимизацию распределения ресурсов, создание AI-ассистентов и исследовательские проекты. Идеальный кандидат имеет 2+ года опыта в Data Science, владеет Python и библиотеками (Pandas, TensorFlow), работает с NLP и SQL. Приветствуется опыт визуализации данных.
🔸 Data Scientist. Сеть клиник НИАРМЕДИК
Специалист должен иметь от 1 года опыта в data science и уверенно владеть Python и библиотеками для анализа данных. Обязанности включают оптимизацию ML-моделей для медицинской документации и совершенствование NLP-систем. Требуется знание математической статистики и алгоритмов, опыт с NLP и фреймворками (Keras, TensorFlow). Реализованные ML проекты в медицине, а также сертификаты профильных онлайн-курсов будут плюсом.
🔸 Младший аналитик данных. Группа компаний МЕДСИ.
Мы разрабатываем экосистему для Медси, включая мобильное приложение SmartMed и MDM-систему. Основное внимание будет уделено обработке текстовых медицинских данных. Необходимо знание Python и основных библиотек для анализа данных (pandas, matplotlib), SQL, Excel и PowerPoint, а также основ математической статистики.
#openbio_вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍3🐳2😍1
Продолжаем знакомиться с методами визуализации данных в Python!
В рамках этого поста рассмотрим библиотеку Seaborn.
Seaborn — библиотека, основанная на Matplotlib, которая легко интегрируется с Pandas и позволяет строить красивые графики одной командой. Она упрощает работу с данными, минимизируя технические детали.
Сегодня мы обсудим уникальные особенности Seaborn и сравним его с Matplotlib.
🔹 Настройка тем
Самый простой способ навести красоту с помощью Seaborn – установить общий стиль для всех графиков (даже если вы строили их другими библиотеками), выбрав одно из готовых решений, что позволяет быстро адаптировать их внешний вид для разных контекстов.
🔹 Статистическая оценка
Многие функции Seaborn автоматически выполняют статистическую оценку и отображают ее результаты на графиках: например, для линейных графиков доступно вычисление и добавление на изображение доверительных интервалов.
Seaborn также позволяет дополнить график более сложными расчетами: так, на диаграммы рассеяния можно добавить модель линейной регрессии с помощью функции
🔹 Представление сложных наборов данных
Некоторые функции Seaborn комбинируют разные типы графиков, чтобы отобразить несколько параметров данных в одном рисунке.
Например, функция
🔹 Группы функций в Seaborn
Функции графиков в Seaborn можно сгруппировать на основе данных, для которых они используются:
● Реляционные функции: отображают взаимосвязи между числовыми переменными.
Примеры:
● Распределительные функции: показывают распределения данных.
Примеры:
● Категориальные функции: сравнивают данные по категориям.
Примеры:
Функции внутри одного модуля имеют общий базовый код и настраиваются схожими наборами аргументов. Это облегчает переключение между способами отображения однотипной информации.
❗️ Параметры, специфичные для функций одного модуля, не отображаются в документации по отдельной функции. Чтобы разобраться со всеми параметрами, настраиваемыми через аргументы, придется покопаться в разных разделах документации Seaborn.
🔹 Связь с Matplotlib
Хотя Seaborn самодостаточен, для более тонкой настройки графиков потребуется подключить к работе Matplotlib. Matplotlib позволяет конфигурировать любой элемент графика, и комбинация функций двух библиотек позволит адаптировать графики под ваши нужды в мельчайших деталях.
Таким образом, Seaborn предоставляет несколько уровней настройки:
● Настройка тем (стилей)
● “Верхнеуровневые” функции, которые позволяют создавать и модифицировать фигуры
● Стандартизированные аргументы внутри групп функций, которые позволяют менять отображение разных типов графиков
● Команды Matplotlib, которые позволяют получить еще больший контроль над изображением.
🔜 Пост получился насыщенным теоретической информацией, но скоро мы отдельно пройдемся по нескольким примерам графиков из Seaborn, поделимся образцами кода, а также опубликуем задачку по материалам недели 😉
#openbio_python #openbio_visualization
💡 Машинное обучение в биологии и биомедицине | OpenBio.Edu
В рамках этого поста рассмотрим библиотеку Seaborn.
Seaborn — библиотека, основанная на Matplotlib, которая легко интегрируется с Pandas и позволяет строить красивые графики одной командой. Она упрощает работу с данными, минимизируя технические детали.
Графики, построенные с помощью Seaborn, часто можно видеть в крутых научных публикациях. Навык строить такие графики точно пригодится для анализа биомедицинских данных, с которыми мы будем работать на курсе “Машинное обучение в биологии и биомедицине”!
Сегодня мы обсудим уникальные особенности Seaborn и сравним его с Matplotlib.
🔹 Настройка тем
Самый простой способ навести красоту с помощью Seaborn – установить общий стиль для всех графиков (даже если вы строили их другими библиотеками), выбрав одно из готовых решений, что позволяет быстро адаптировать их внешний вид для разных контекстов.
🔹 Статистическая оценка
Многие функции Seaborn автоматически выполняют статистическую оценку и отображают ее результаты на графиках: например, для линейных графиков доступно вычисление и добавление на изображение доверительных интервалов.
Seaborn также позволяет дополнить график более сложными расчетами: так, на диаграммы рассеяния можно добавить модель линейной регрессии с помощью функции
lmplot()
.🔹 Представление сложных наборов данных
Некоторые функции Seaborn комбинируют разные типы графиков, чтобы отобразить несколько параметров данных в одном рисунке.
Например, функция
jointplot()
показывает совместное распределение двух числовых переменных и дополняет их распределением каждой переменной в отдельности, сочетая таким образом scatter plot и гистограммы.🔹 Группы функций в Seaborn
Функции графиков в Seaborn можно сгруппировать на основе данных, для которых они используются:
● Реляционные функции: отображают взаимосвязи между числовыми переменными.
Примеры:
scatterplot
, lineplot
.● Распределительные функции: показывают распределения данных.
Примеры:
histplot
, kdeplot
и boxplot
.● Категориальные функции: сравнивают данные по категориям.
Примеры:
barplot
, countplot
и violinplot
.Функции внутри одного модуля имеют общий базовый код и настраиваются схожими наборами аргументов. Это облегчает переключение между способами отображения однотипной информации.
🔹 Связь с Matplotlib
Хотя Seaborn самодостаточен, для более тонкой настройки графиков потребуется подключить к работе Matplotlib. Matplotlib позволяет конфигурировать любой элемент графика, и комбинация функций двух библиотек позволит адаптировать графики под ваши нужды в мельчайших деталях.
Таким образом, Seaborn предоставляет несколько уровней настройки:
● Настройка тем (стилей)
● “Верхнеуровневые” функции, которые позволяют создавать и модифицировать фигуры
● Стандартизированные аргументы внутри групп функций, которые позволяют менять отображение разных типов графиков
● Команды Matplotlib, которые позволяют получить еще больший контроль над изображением.
#openbio_python #openbio_visualization
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥6👍2🤔1
Друзья, недавно мы просили вас поделиться мнением о сложности и форматах контента в канале.
❤️ Команда проекта благодарит всех, кто уделил время и проголосовал в опросе, и дарит вам гайд с бесплатными материалами по изучению ML, который поможет подготовиться к курсу «Машинное обучение в биологии и биомедицине».
Также админы канала получили несколько запросов о публикации этого гайда в открытом доступе, и вот сегодня, когда нас уже более 500 человек, мы решили опубликовать гайд для всех!
Благодарим вас за то, что вы с нами, и рады быть вашим проводником в мир ML в биологии и биомедицине!
🎁 Забрать гайд
PS высказать свое мнение о контенте, если вы еще не, можно в этом посте.
#openbio_дарит_подарки
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu
Также админы канала получили несколько запросов о публикации этого гайда в открытом доступе, и вот сегодня, когда нас уже более 500 человек, мы решили опубликовать гайд для всех!
Благодарим вас за то, что вы с нами, и рады быть вашим проводником в мир ML в биологии и биомедицине!
PS высказать свое мнение о контенте, если вы еще не, можно в этом посте.
#openbio_дарит_подарки
Please open Telegram to view this post
VIEW IN TELEGRAM
😍4👍3🔥3
Сегодня на учебных данных мы:
● изучим основные шаги при работе с графиками в Seaborn
● воспользуемся парой упрощающих жизнь фичей
● построим несколько графиков для разных типов данных
● и закрепим материалы недели небольшой задачей
Присоединяйтесь к курсу "Машинное обучение в биологии и биомедицине", чтобы узнать больше хитрых приемов для обработки ваших данных.
Курс стартует 25 февраля, и до 5 января еще актуальны цены раннего бронирования 😉
import pandas as pd
data = ... # не будем дублировать создание датасета для экономии места
df = pd.DataFrame(data)
import seaborn as sns
sns.set_style(‘darkgrid’)
Seaborn позволяет легко адаптировать графики под разные форматы презентации — от компактных рисунков для научных статей до крупных картинок для постеров.
В ключевой аргумент функции
sns.set_context()
передается контекст – “notebook”
, “paper”
, “poster”
, “talk”
, – а дополнительные аргументы позволяют шкалировать отдельные элементы графика.sns.set_context("notebook", font_scale=1.25)
● data: указывает датафрейм, с которым мы работаем
● x: столбец, данные из которого будут отложены на оси Х
● y: столбец, данные из которого будут отложены на оси Y
Такой принцип дает возможность меньше ломать голову над синтаксисом.
Эти графики отображают соотношения числовых значений. Обратите внимание, что при построении линейного графика автоматически добавляется доверительный интервал.
sns.scatterplot(data=df, x='Год заболевания', y='Срок лечения')
sns.lineplot(data=df, x='Год заболевания', y='Срок лечения)
Оценим распределение пациентов по возрастам – построим гистограмму.
sns.histplot(data=df, x='Возраст', bins=4)
Показать совместное распределение возраста, например, со сроками лечения поможет метод
sns.jointplot()
. В аргументах функции нужно указать набор данных для двух осей – X и Y.sns.jointplot(x=df['Возраст'], y=df['Срок лечения'])
Как и в предыдущем пункте, тут нужно указывать данные для двух осей: на одной будут категориальные значения, на другой – числовые.
sns.violinplot(data=df, x='Диагноз', y='Возраст')
sns.swarmplot(data=df, x=’Год заболевания', y=’Возраст')
● sns.relplot(kind=’scatter’) = sns.scatterplot()
● sns.distplot(kind=’hist’) = sns.histplot()
● sns.catplot(kind=’violin’) = sns.violinplot()
➡️ Время практики!
Один из самых популярных способов визуализации числовых данных — графики “ящик с усами” (boxplot). Они показывают распределение данных и элементы описательной статистики.❔ С помощью Matplotlib И Seaborn постройте boxplot, которые будут отображать зависимость срока лечения от диагноза. На оси X разместите две группы диагнозов, А и Б.
Подсказки:● Боксплот строится на основании набора чисел, по которым автоматически считается описательная статистика. Применять groupby() и агрегацию тут не нужно ● В Matplotlib передайте сабсеты данных для каждого диагноза в аргумент "х" ● Советуем освежить в памяти нашу шпаргалку по фильтрации данных в Pandas ● Решить задачу в Seaborn гораздо легче 👀
Присылайте получившиеся у вас графики в комментариях! Код для выполнения задачи опубликуем в среду.
#openbio_python #openbio_pandas #openbio_visualization
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2🆒2
4 главных правила составления резюме.
1️⃣ Это база, но не указывайте в резюме то, чем вы не хотите заниматься. И даже не потому, что такой подход спасет вас от выгорания. 🙂 Четко сформулированные критерии поиска повысят качество поступающих предложений и быстрее приведут вас к желаемому результату.
2️⃣ Если мы говорим про резюме для деятельности, которой вы никогда не занимались (или в чем у вас мало опыта), найдите релевантный опыт в вашей предыдущей деятельности и используйте его.
3️⃣ Резюме должно четко отражать то, что работодатель ожидает увидеть от сотрудника на искомой позиции.
Одно резюме — одна мысль. Поэтому необходимо убирать всё, что не относится к конкретной позиции.
Если у вас два разных профессиональных вектора развития (по сути две параллельные вакансии), должно быть два разных резюме. И в зависимости от конкретной позиции, нужно указывать тот или иной опыт. И да, иногда он может быть даже противоположным. 🙃
4️⃣ Через резюме должна передаваться идея, которая является основным результатом и самым важным навыком для работы в профессии.
Если мы говорим про ученого, должна быть видна экспертность, способность глубоко и нестандартно мыслить, а также другие навыки, в зависимости от сферы: наличие коллаборации, количество статей или успешных прототипов и тд. Преподносите свой предыдущий опыт именно в таком направлении.
➡️ Еще больше идей и лайфхаков для построения успешной карьеры в биоинформатике вы услышите уже завтра, на вебинаре «Карьерный путь биоинформатика: от студента до сеньора» с Анной Фоминой!
Встречаемся завтра, 24 декабря в 19:00 по Мск.
❕ Обязательно регистрируйтесь на сайте, чтобы получить ссылку на эфир.
PS А специально для нашей аудитории Анна записала кружочек-приглашение😍
Ждем вас завтра!
#openbio_career
#openbio_webinar
#openbio_interview
#openbio_expert
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu
Пример: вы никогда не делали анализ NGS-данных «руками», но работали над интерпретацией результатов такого анализа и владеете базовыми программами для обработки отдельных видов сырых данных. Этот опыт является схожим, его можно расписать по навыкам и указать в резюме.
Одно резюме — одна мысль. Поэтому необходимо убирать всё, что не относится к конкретной позиции.
Если у вас два разных профессиональных вектора развития (по сути две параллельные вакансии), должно быть два разных резюме. И в зависимости от конкретной позиции, нужно указывать тот или иной опыт. И да, иногда он может быть даже противоположным. 🙃
Если мы говорим про ученого, должна быть видна экспертность, способность глубоко и нестандартно мыслить, а также другие навыки, в зависимости от сферы: наличие коллаборации, количество статей или успешных прототипов и тд. Преподносите свой предыдущий опыт именно в таком направлении.
Встречаемся завтра, 24 декабря в 19:00 по Мск.
PS А специально для нашей аудитории Анна записала кружочек-приглашение
Ждем вас завтра!
#openbio_career
#openbio_webinar
#openbio_interview
#openbio_expert
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
😍2🐳2
Сегодня мы завершим тему визуализации данных разбором еще одной библиотеки, а именно… Pandas! 🐼
Все верно — помимо функций из специальных библиотек Matplotlib и Seaborn инструменты для визуализации данных также встроены непосредственно в Pandas, что позволяет строить различные типы графиков прямо через методы, применяющиеся к DataFrame. Сегодня изучим особенности такого подхода.
1️⃣ Вновь создадим тренировочный датасет с медицинскими данными:
2️⃣ Для построения графиков в Pandas используется метод
Метод plot() имеет множество аргументов, позволяющих настроить как внешний вид графика, так и тип данных, которые будут отображены.
➕ Как и функции Seaborn,
● Data: указывает объект, для которого будет построен график. Это может быть целый датафрейм или его отдельные столбцы.
● x и y: указывают имена столбцов для осей x и y.
❗️ Для некоторых типов графиков, таких как scatterplot, необходимо указать обе оси.
➕ Еще одно сходство с Seaborn — возможность выбирать тип графика с помощью аргумента
➕
Ряд параметров позволяет повысить информативность графиков:
➕ Аргументы
➕
➕ Для детальной настройки графиков можно изменять стиль линий, устанавливать цвета, изменять размеры графиков, добавлять сетки, настраивать метки и т.д. Все это также можно сделать с помощью аргументов.
Рассмотрим пример использования этих параметров, построив максимально нарядный график:
Таким образом, встроенный функционал Pandas позволяет легко создавать простые графики и настраивать их стиль. Визуализация данных с помощью Pandas часто применяется для предварительного анализа, а Matplotlib и Seaborn подключают для более сложных визуализаций.
Однако у вас есть полная свобода выбора! Теперь, когда вы освоили основы работы с этими инструментами, вы можете выбирать те методы, которые вам больше всего нравятся. Желаем удачи в экспериментах и творчестве!❤️
#openbio_python #openbio_pandas #openbio_visualization
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu
Все верно — помимо функций из специальных библиотек Matplotlib и Seaborn инструменты для визуализации данных также встроены непосредственно в Pandas, что позволяет строить различные типы графиков прямо через методы, применяющиеся к DataFrame. Сегодня изучим особенности такого подхода.
➡️ И напоминаем, что вебинар «Карьерный путь биоинформатика: от студента до сеньора» с Анной Фоминой состоится уже сегодня! Подключайтесь 24 декабря в 19:00 по Мск.
import pandas as pd # больше ничего не понадобится!
data = {
'ID': range(1, 11),
'Возраст': [45, 60, 25, 50, 75, 33, 40, 29, 65, 55],
'Пол': ['М', 'Ж', 'М', 'М', 'Ж', 'М', 'Ж', 'Ж', 'М', 'Ж'],
'Диагноз': ['Гипертония', 'Здоров', 'Здоров', 'Диабет', 'Гипертония', 'Диабет', 'Гипертония', 'Здоров', 'Гипертония', 'Здоров']
}
df = pd.DataFrame(data)
df.head()
df.plot()
, который является “оберткой” для методов matplotlib (то есть, “под капотом” вызывает функции другой библиотеки).Метод plot() имеет множество аргументов, позволяющих настроить как внешний вид графика, так и тип данных, которые будут отображены.
df.plot()
имеет аргументы для выбора данных:● Data: указывает объект, для которого будет построен график. Это может быть целый датафрейм или его отдельные столбцы.
● x и y: указывают имена столбцов для осей x и y.
kind
. Примеры частых значений: 'line'
, 'bar'
, 'hist'
, 'box'
, 'scatter'
.subplots
: по умолчанию, если построить график по двум или более столбцам датафрейма, данные из них будут отображены на одном графике. При значении аргумента subplots=True каждый столбец будет отображаться в отдельном подграфике. Это удобный способ добавить на рисунок несколько срезов данных одной командой.# Попробуйте построить график с subplots и без:
df[['Возраст', 'Вес']].plot(kind='bar)
Ряд параметров позволяет повысить информативность графиков:
title
, xlabel
и ylabel
добавляют подписи всему графику и осям, соответственно.legend
: при выставленном значении True
добавляет на график легенду, которую дальше тоже можно кастомизировать.Рассмотрим пример использования этих параметров, построив максимально нарядный график:
df['Возраст'].plot(kind='line',
color='teal',
marker='*', markersize=12,
linestyle='dashdot',
alpha=0.7,
xlabel='Пациент',
ylabel='Возраст'
)
Таким образом, встроенный функционал Pandas позволяет легко создавать простые графики и настраивать их стиль. Визуализация данных с помощью Pandas часто применяется для предварительного анализа, а Matplotlib и Seaborn подключают для более сложных визуализаций.
Однако у вас есть полная свобода выбора! Теперь, когда вы освоили основы работы с этими инструментами, вы можете выбирать те методы, которые вам больше всего нравятся. Желаем удачи в экспериментах и творчестве!
➡️ Ждем вас на курсе “Машинное обучение в биологии и биомедицине”, где вы сможете применить все новые знания на практике! Старт нового потока — 25 февраля 2025.
#openbio_python #openbio_pandas #openbio_visualization
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1
Приближается пора новогодних обещаний. Мы решили добавить немного волшебства
При помощи бота, мы выберем трех победителей, которые получат скидки 50%, 70% и 90% на обучение на курсе «Машинное обучение в биологии и биомедицине» соответственно.
1. быть подписанным на канал Машинное обучение в биологии и биомедицине | OpenBio.Edu;
2. нажать кнопку «Хочу изучать ML с OpenBio!» в посте ниже.
Итоги конкурса будут подведены и опубликованы в канале 31 декабря в 16:00 по Москве. Желаем удачи!
А для всех, кто не полагается на удачу, а верит только в свои силы
Промокод активен до 31 декабря 23:59 и исчезнет вместе с боем курантов🥂
Правила участия в конкурсе:
- Наличие репоста конкурсного поста — не обязательное условие участия в розыгрыше, но нам будет приятно, если вы это сделаете и расскажете вашим друзьям о такой возможности.🙃
- Первый отобранный ботом победитель получит скидку 50%, второй 70%, третий 90%.
- Скидки распространяются только на участие в весеннем потоке курса, который стартует 25 февраля, и имеют срок действия до 25 февраля включительно.
- Применить каждую скидку можно только 1 раз.
#openbio_дарит_подарки
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥26🐳7🤓7⚡6😁6😍6🤔5👍1
🎁 Для участия в розыгрыше, нажмите кнопку «Хочу изучать ML с OpenBio!»
🔥15👍4😍2
Сегодня в рамках нашей регулярной рубрики мы представляем свежую подборку новостей из мира науки и индустрии, связанных с ИИ и машинным обучением! Мы выделили самые интересные обзоры новых разработок, а также нашли пару обсуждений проблем при интеграции ИИ в систему здравоохранения.
Прикрепляем ссылки, по которым можно найти оригинальные публикации:
➡️ Новости о том, как ИИ и машинное обучение преобразуют медицинскую практику, появляются каждый день. Откройте для себя высокотехнологичные подходы к лечению и диагностике на курсе “Машинное обучение в биологии и биомедицине” и будьте в центре инноваций!🔬
#openbio_news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2
Друзья!
⏱ Уже завтра, в 16:00 по Москве, будут подведены итоги розыгрыша. Успейте принять участие и рассказать вашим коллегам и сокурсникам о такой возможности!
Также завтра, 31 декабря в 23:59, вместе с боем курантов🔔 закончит свое действие промокод NEWYEAR, который дает скидку 20% на курс «Машинное обучение в биологии и биомедицине».
Приходите на курс, чтобы усилить свои профессиональные компетенции:
🔷 изучить и начать применять передовые методы биоинформатики, а также нейросети;
🔷 углубить знание Python;
🔷 использовать ML в NGS и распознавании изображений из клинических данных;
🔷 расширить понимание составных частей процессов, которые лежат в основе популярных пайплайнов.
Желаем удачи, и с нетерпением ждем результатов конкурса вместе с вами!🫰 А тех, кто не полагается на волю случая, приглашаем на курс «Машинное обучение в биологии и биомедицине» уже сейчас.
#openbio_дарит_подарки
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu
Также завтра, 31 декабря в 23:59, вместе с боем курантов
Уже на первой неделе следующего года будет повышение цен на обучение.
Эти дни уходящего года — последняя возможность инвестировать в свою карьеру на максимально выгодных условиях.
Приходите на курс, чтобы усилить свои профессиональные компетенции:
Желаем удачи, и с нетерпением ждем результатов конкурса вместе с вами!
#openbio_дарит_подарки
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍2😍2🐳2