Новосибирск. Атомное и молекулярное моделирование: современные подходы и алгоритмы, Молекулярно-динамическое моделирование и его приложения, Технологии суперкомпьютерного и атомистического ML
Петрозаводск. Теоретическая часть обучения пройдет в формате лекций и семинаров? А для решения кейсов – реальных задач от партнеров – будет сформировано несколько продуктовых команд под руководством опытных наставников
Дедлайн 27 июня.
Университет ИТМО, Санкт-Петербург приглашает на воркшоп, который заканчивается решением реального кейса в формате хакатона.
Сколково, Институт науки и технологий. В программе секции по компьютерным наукам в биологии и смежным дисциплинам. Дедлайн подачи тезисов уже прошел, но можно посетить конференцию в качестве слушателя.
В Екатеринбурге, на базе Института экологии растений и животных Уральского отделения РАН пройдет конференция? в которой затронут темы эволюционные процессы с точки зрения современной генетики. Эволюционная и историческая экология; Перспективы применения новых методов генетики, геномики и селекции в решении проблем продовольственной безопасности;
Дедлайн 1 июля.
Конференция пройдет в 2 этапа: первый в сентябре, в Севастополе на базе Института перспективных исследований Севастопольского государственного университета; второй - в Москве на базе Физического факультета Московского государственного университета им. М.В. Ломоносова, в программе: Общая биофизика, Молекулярная биофизика и биоинформатика, Медицинская биофизика и биофизическая химия, Биофизическая экология.
Дедлайн 20 июля
Место проведения Наукоград Кольцово. OpenBio — крупнейший форум молодых ученых по биотеху и смежным отраслям. В программе: секции по генетике, биоинформатике, вирусологии, фундаментальной медицине и фарме.
Дедлайн 1 августа.
Онлайн-симпозиум для специалистов по компьютерному поиску и разработке лекарств, анализу биологических путей, моделированию молекул, ML и AI для фармацевтики и медицины.
Дедлайн подачи тезисов — до 31 августа, зарегистрироваться в качестве слушателя или представителя онлайн- постера можно до 25 сентября
Сколково, Институт науки и технологий.
В программе: доклады из области генетики, молекулярной биологии, метагеномики и биохимии микроорганизмов, включая трансляционную микробиологию и геномное редактирование.
Дедлайн подачи тезисов до 30 июня
Дедлайн регистрации на конференцию до 15 сентября
Институт биологии развития им. Н.К. Кольцова РАН, г. Москва проводит конференцию по сравнительной физиологии сигнальных систем, эволюции механизмов сигнализации, генетическим и эпигенетическим механизмам физиологических процессов и поведения, молекулярно-клеточным механизмам функционирования сенсорных и двигательных систем.
Дедлайн подачи тезисов 31 августа
Поделись с друзьями и посещайте мероприятия вместе!
#openbio_events #биотех #openbio_education #конференции
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3😍2
Машинное обучение в биологии и биомедицине | OpenBio.Edu
Открываем третий сезон цикла лекций «Личный путь в сеньора биоинформатика» встречей с Никитой Ваулиным. 🔬 Никита - биоинформатик и преподаватель программирования для биологов в ВШЭ и Институте биоинформатики, сейчас PhD-студент в группе Игоря Адамейко в…
Мы решили, что эфир будет проходить прямо здесь в телеграм -канале.
Вопросы можно задавать в комментариях под этим постом.
📌 Зарегистрируйтесь, если планируете смотреть встречу в записи.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👍2😍1
Для команды OpenBio отзывы — это не просто слова, а фундамент для роста. Мы стремимся создавать курсы, которые по-настоящему ценны и востребованы. Рады поделиться с вами впечатлениями участников весеннего потока — это подтверждает, что мы на верном пути. Наша главная награда — видеть, как вы с удовольствием учитесь, рекомендуете нас друзьям и возвращаетесь за новыми знаниями ❤️
P.S. Кстати, завтра у нас первое повышение цен, поэтому если планировали осенью прийти к нам — самое время оставить заявку и зафиксировать текущую стоимость.
#openbio_review #openbio_education #openbio_ml
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
P.S. Кстати, завтра у нас первое повышение цен, поэтому если планировали осенью прийти к нам — самое время оставить заявку и зафиксировать текущую стоимость.
#openbio_review #openbio_education #openbio_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2🔥1👏1
кросс-валидация
и бутстрэппинг
, которые помогают лучше использовать доступную информацию и честно оценивать модель.Кросс-валидация
Кросс-валидация
— это метод оценки качества модели, при котором данные делят на несколько частей (фолдов); модель обучают на большинстве частей и тестируют на оставшейся. Этот процесс повторяют так, чтобы каждая часть использовалась в роли тестовой хотя бы один раз. Например, при k
-fold данные разбиваются на k
равных частей, модель обучается на k
-1 частей, на оставшейся части тестируется, и процедура повторяется k
раз.Этот метод использует все данные для обучения и оценки поэтапно, что позволяет эффективно использовать каждый образец, повышая тем самым объективность, что особенно полезно при малых выборках, а также облегчает сравнение моделей и настройку гиперпараметров. Однако он чувствителен к особенностям разбиения и при очень малых объемах (
k
<5) может давать менее надежные результаты.Бутстрэппинг
Бутстрэппинг
— это метод случайной выборки с возвращением. Из исходных данных формируется множество бутстрэп
-выборок одинакового размера равного по размеру исходной выборки с помощью случайного выбора элементов (причем элементы могут и будут повторяться). На каждой такой выборке модель обучается, а её качество оценивается на тех данных, которые не попали в эту выборку (out-of-bag данные).Этот метод позволяет оценить стабильность и доверительные интервалы метрик, что повышает надежность результатов, при этом не требуя строгого разбиения данных, что особенно важно при очень малых выборках. Однако при очень небольшом объеме данных оценки могут быть менее точными, а большое число повторных обучений увеличивает время вычислений, что может стать недостатком при работе с большими наборами данных или при необходимости быстрого получения результатов.
Что выбрать?
Хотите оценить точность модели — используйте
кросс-валидацию
, устойчивость — применяйте бутстрэппинг
. В идеале — комбинируйте оба метода для получения ясного представления о качестве модели.Как выглядит код на практике можно узнать здесь. Узнать больше о
кросс-валидации
и бутстрэппинге
можно здесь и здесь, ну и, конечно, на нашем курсе.#openbio_education #openbio_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10❤3👍2
Поставьте отметку в пяти коротких опросах ниже — это займёт минуту, а нам поможет сделать контент в нашем канале чуть более прицельным!
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤6👍3🐳1
Как вы определили ваш уровень программирования и опыта в Data Science?
Anonymous Poll
36%
Начальный (или почти начальный) — ничего или почти ничего не умею делать с сырыми данными
39%
Новичок — есть опыт обработки данных в R или Python, простые таблички могу посчитать
18%
Средний — уже более 2-3 лет занимаюсь обработкой данных, сделал несколько проектов
7%
Продвинутый — набил руку во многих проектах, занимаюсь углублением знаний
Для каких задач вы примеряете для себя знания по машинному обучению?
Anonymous Poll
31%
Геномика, транскриптомика, эпигеномика
17%
Протеомика и структурная биология
20%
Анализ медицинских изображений и патология
23%
Клинические исследования и персонализированная медицина
44%
Начинаю свой путь в ML / Хочу понять общие принципы применения ML в биологии.
7%
Другое (напишите в комментариях!)
Какие трудности вы чаще всего встречаете, когда пытаетесь применять машинное обучение в своих биологических задачах?
Anonymous Poll
26%
Подготовка и очистка биологических данных — слишком много «шума», пропуски
26%
Выбор правильного ML-алгоритма — много вариантов, не понимаю, что выбрать
26%
Интерпретация результатов модели — как понять, что модель делает и почему
22%
Нехватка вычислительных ресурсов — медленно работает, нет доступа к мощным серверам
28%
Интеграция ML с биологическими знаниями — как связать возможности ML с моей спецификой
20%
Поиск и понимание релевантных инструментов и библиотек
34%
Пока не применяю, но читаю полезные материалы на будущее
3%
Другое (напишите в комментариях!)
❤4👍2👏2
Собрали всё: от NGS и биостатистики до диффузионных моделей и мультимодальных омикс-данных. Позиции открыты — резюме в бой!
Требования: 3+ лет опыта построения и эксплуатации ML-систем: Python 3.*, PyTorch/TF, scikit-learn, NumPy/Pandas. Стек Data Engineering: SQL/NoSQL, Spark или Dask, Airflow/Prefect, REST/gRPC-сервисы. Опыт работы с HPC или облачными GPU-ресурсами, оптимизацией вычислений (CUDA, mixed-precision, distributed training). Глубокие знания статистики, экспериментального дизайна и методов оценки неопределённости. Умение читать и реализовывать state-of-the-art статьи (NeurIPS, ICML, Nature Methods).
Уровень дохода не указан
Требования: уверенные навыки программирования: знание R (Bioconductor), Python (Biopython, Pandas, Numpy); уверенное владение Linux, знание Bash; опыт работы с NGS-данными на уровне разработки биоинформатических пайплайнов анализа данных (геном, транскриптом, метилом, таргетное секвенирование панелей генов); опыт работы с Docker, Git; опыт работы с SQL; знание биомедицинской статистики; опыт научной деятельности не менее 2 лет;
Уровень дохода не указан
Требования: Постдок, Возможны любые специальности в области естественных и медицинских наук
100 - 120 тыс. руб. + надбавки с грантов
Требования: BostonGene ищет CV-инженера для анализа MxIF, H&E, IHC изображений и разработки мультимодальных DL-моделей (на базе diffusion), с соблюдением GCP/GCLP.
Уровень дохода не указан
Требования: BostonGene ищет дата-аналитика для работы с multi-omics (NGS, CyTOF), построения моделей ответа на терапию и анализа биомаркеров в онкоисследованиях
Уровень дохода не указан, но предусмотрена помощь в релокации
#openbio_вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👍1🔥1
Уверены, вы уже знакомы с ChatGPT или его аналогами. Готовы обновить знания?
Предлагаем вам🤫 🫠 🤥 😶 !
За 5 дней дадим концентрат методов использования LLM в профессиональной деятельности прицельно для биомеда. Готовьтесь тестить инструменты!
Старт —1️⃣ 4️⃣ июля прямо здесь в нашем телеграм - канале.
Каждый день посвятим разбору практических подходов и покажем как их сразу внедрить в работу:
✔️ разберем, какие LLM полезны в биологии (спойлер: не только ChatGPT)
✔️ сравним модели друг с другом и обсудим практики промт-инжиниринга
✔️ расскажем как учиться с ИИ-ассистентами и выполнять задачи на работе
✔️ ну и, конечно, дадим примеры как это работает у нас :)
🎁 Бонусы для тех, кто дойдет до конца
🔥 До начала — всего 6 дней. Не пропусти! 🔥
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Предлагаем вам
За 5 дней дадим концентрат методов использования LLM в профессиональной деятельности прицельно для биомеда. Готовьтесь тестить инструменты!
Старт —
Каждый день посвятим разбору практических подходов и покажем как их сразу внедрить в работу:
🔥 До начала — всего 6 дней. Не пропусти! 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤20👍9🔥5
👋 Сегодня погрузимся в мир, где данных слишком много, но информации — мало. Речь о методах понижения размерности — ключевом инструменте в анализе сложных биологических данных, который помогает увидеть главное, отбросив "шум".
Что это и зачем нужно биологу?
Современные биомедицинские исследования часто сталкиваются с огромными объемами данных: например, у пациентов записаны тысячи характеристик — возраст, уровни веществ в крови, генетическая информация и так далее... Это "многомерное" пространство. Понижение размерности помогает "сжать" эти данные, сохранив при этом их наиболее важные свойства, чтобы:
🔺 визуализировать кластеры и группы (которые иначе не увидеть);
🔺 удалить избыточную и зашумлённую информацию;
🔺 ускорить работу алгоритмов машинного обучения.
Но какой метод выбрать?
Смотрите в карусели и делитесь, какие методы понижения размерности вы используете чаще всего в своей работе? Какие "подводные камни" встречали? Поделитесь своим опытом в комментариях! 👇
Еще больше о PCA, t-SNE, UMAP, VAE.
В следующий раз поговорим о том, как с помощью методов аугментации можно создавать дополнительные образцы.
#openbio_education
🔥До старта LLM-спринта осталось 4 дня!🔥
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Что это и зачем нужно биологу?
Современные биомедицинские исследования часто сталкиваются с огромными объемами данных: например, у пациентов записаны тысячи характеристик — возраст, уровни веществ в крови, генетическая информация и так далее... Это "многомерное" пространство. Понижение размерности помогает "сжать" эти данные, сохранив при этом их наиболее важные свойства, чтобы:
Но какой метод выбрать?
Смотрите в карусели и делитесь, какие методы понижения размерности вы используете чаще всего в своей работе? Какие "подводные камни" встречали? Поделитесь своим опытом в комментариях! 👇
Еще больше о PCA, t-SNE, UMAP, VAE.
Кстати, на нашем курсе по машинному обучению мы уделяем несколько семинаров на практику с методами снижения размерности.
В следующий раз поговорим о том, как с помощью методов аугментации можно создавать дополнительные образцы.
#openbio_education
🔥До старта LLM-спринта осталось 4 дня!🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10✍3👍2