Принцип работы Llamole:
Система обучена на собственных наборах данных, созданных специально для проекта: они включают сотни тысяч патентованных молекул и сгенерированные AI-описания к ним.
При этом, в отличие от 14 других моделей, включая очень крупные с 70 миллиардами параметров, Llamole остаётся компактной: «всего» 7 миллиардов параметров, но именно на их основе достигаются лучшие результаты по 12 ключевым метрикам.
📌 Эксперты OpenBio уже рассказывали, почему сочетание обработки разных типов данных меняет правила игры. Загляните в наш пост с карточками от N+1, где Александр Сарачаков и другие спикеры курса делятся трендами ML в биологии.
#openbio_news #биотех #наука #openbio_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15🔥6👍3🤔3
Сегодня в центре внимания — цикл While! 🔁
Это один из самых простых и мощных инструментов для автоматизации повторяющихся задач. Он позволяет выполнять блок кода многократно, пока выполняется определённое условие.
📌 Если вы уже освоили базовую работу с библиотеками NumPy и pandas, научились читать и обрабатывать датасеты, группировать, и визуализировать векторные операции — самое время перейти к управлению потоком выполнения кода. Цикл
Например:
Здесь
📌 Структура цикла while в Python:
➖ Условие — логическое выражение, которое проверяется перед каждой итерацией.
➖ Двоеточие (:) сообщает Python, что далее — блок команд.
➖ Тело цикла — команды с отступом, которые выполняются, пока условие истинно.
❕
📌 Сравнение с оператором
Цикл
➖
➖
Оба могут использовать логические операторы
Этот цикл будет продолжаться, пока уровень свёртки меньше 8 и белок остаётся токсичным. Когда
📌 Бесконечные циклы
Цикл
Чтобы остановить такой цикл, используют
Этот код будет спрашивать показатель качества, пока пользователь не введёт корректное значение выше
❕ Всегда следите за условиями цикла и используйте
Цикл
↗️ Освоив базовые принципы, вы сможете перейти к более сложным паттернам: вложенным циклам, контролю итераций через
🔭
#openbio_python #openbio_ml #openbio_education
Это один из самых простых и мощных инструментов для автоматизации повторяющихся задач. Он позволяет выполнять блок кода многократно, пока выполняется определённое условие.
while
— фундаментальная конструкция, которая пригодится в любом проекте.Например:
ридов_прочитано = 0 # Количество прочитанных фрагментов ДНК
цель_ридов = 1000 # Требуемое количество
while ридов_прочитано < цель_ридов:
print(f"Прочитано {ридов_прочитано} ридов. Ещё собираем...")
ридов_прочитано += 100 # Имитация чтения 100 ридов за шаг
Здесь
while
проверяет условие ридов прочитано < цель_ридов
. Пока оно истинно, выполняется print(count)
и увеличивается значение переменной ридов прочитано
. Когда ридов прочитано
достигнет 1000
или больше — цикл завершится.while условие:
Тело цикла
While
— это цикл с предусловием: сначала проверяется условие, и только если оно истинно — выполняется тело цикла.if
и логические операцииЦикл
while
напоминает условный оператор if
, но с повторением:if
выполняет код один раз, если условие истинно.while
выполняет код многократно, пока условие остаётся истинным.Оба могут использовать логические операторы
and, or, not
:белок_свернут = 0 # Уровень правильной свёртки белка (0-10)
токсичность = True # Моделируем, что белок токсичен на старте
while белок_свернут < 8 and токсичность:
print(f"Свёртка: {белок_свернут}. Белок пока токсичен.")
белок_свернут += 1 # Улучшаем свёртку
if белок_свернут >= 5:
токсичность = False # Допустим, после 5 уровня свёртки токсичность исчезает
Этот цикл будет продолжаться, пока уровень свёртки меньше 8 и белок остаётся токсичным. Когда
белок_свернут
станет 5, токсичность переключится в False
и цикл завершится, даже если свёртка не достигла 8.Цикл
while
может стать бесконечным, если условие всегда истинно:while True:
print("Ищем идеальную последовательность...")
# Здесь могла бы быть сложная функция анализа
Чтобы остановить такой цикл, используют
break
:консенсус_найден = False # Флаг нахождения консенсуса
while True:
показатель_качества = float(input("Введите показатель качества сборки (0.0-1.0): "))
if показатель_качества > 0.95:
print("Отлично! Сборка соответствует стандарту:", показатель_качества)
break # Выходим из цикла, т.к. цель достигнута
else:
print("Качество сборки недостаточно. Попробуйте ещё раз.")
Этот код будет спрашивать показатель качества, пока пользователь не введёт корректное значение выше
0.95
.break
осознанно, бесконечные циклы могут «повесить» программу.Цикл
while
— универсальный инструмент, которым пользуется почти каждый биоинформатик, особенно при парсинге данных, автоматизации рутинных задач и построении пайплайнов. Он позволяет создавать гибкие конструкции и управлять выполнением кода с максимальной точностью.continue
и else
, созданию симуляций и генераторов.While
обязательно пригодится в ваших проектах — от простых до исследовательских. Главное — начать, практиковать и не бояться экспериментов.#openbio_python #openbio_ml #openbio_education
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7😍4👍2🔥1🤓1👨💻1
Открываем третий сезон цикла лекций «Личный путь в сеньора биоинформатика» встречей с Никитой Ваулиным.
🔬 Никита - биоинформатик и преподаватель программирования для биологов в ВШЭ и Институте биоинформатики, сейчас PhD-студент в группе Игоря Адамейко в Вене, где изучает механизмы принятия клеточных решений (cell fate decisions). Закончил биофизику в питерском Политехе и магистратуру Сколтеха. Фанат Hi-C и 3D-геномики в целом. Мы пригласили Никиту рассказать, как ему дается обучение в Вене и о чем там мечтают биоинформатики.
Начало эфира 25 июня в 19:00 по Мск.
На встрече мы обсудим детали карьерного трека Никиты, лайфхаки поступления на PhD, тренды отрасли и образования в области биоинформатики и многое другое.
✔️ Зарегистрируйтесь, чтобы не пропустить напоминание о прямой трансляции и получить запись встречи.
❔ Задавайте вопросы спикеру в комментариях к этому посту, чтобы мы могли их озвучить.
Увидимся на эфире!
#openbio_career #openbio_webinar #openbio_interview
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Начало эфира 25 июня в 19:00 по Мск.
Трансляции проходят в рамках курса «Машинное обучение в биологии и биомедицине» от OpenBio.
До старта программы еще далеко, но уже можно записаться по минимальной цене↗️
На встрече мы обсудим детали карьерного трека Никиты, лайфхаки поступления на PhD, тренды отрасли и образования в области биоинформатики и многое другое.
Увидимся на эфире!
#openbio_career #openbio_webinar #openbio_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤10👍3👏1
Второй поток курса "Машинное обучение в биологии и биомедине" успешно завершил основную программу и сейчас работает над итоговым соревнованием.
А мы с радостью объявляем набор на осеннюю программу, которая стартует1️⃣ октября! 🎉
Каждый запуск мы стремимся улучшить эффективность обучения. Главный плюс нашей программы — внушительный ассортимент методов и фокус на двух востребованных направлениях: ML в анализе омиксных данных и Computer Vision в биомедицине.
Что вы получите за 4,5 месяца?
✔️ Системное понимание ML в контексте биомедицинских данных
✔️ 6 практических кейсов для вашего портфолио
✔️ Готовые протоколы обработки и реальные датасеты
✔️ Уверенность в применении классических методов ML плюс опыт работы с нейросетями с углублением в Computer Vision
Формат обучения и поддержка:
Обучение проходит в гибком формате: смотрите видеолекции, когда удобно, участвуйте в прямых эфирах с преподавателями, а в чатах всегда можно задать вопрос кураторам и наставникам.
Поддержка не заканчивается с курсом — материалы и доступ к сообществу останутся с вами на целый год! 🤝
➡️ Узнать подробности и подать заявку на участие по стартовой цене можно по ссылке.
#openbio_ml #openbio_education #машинноеобучение #машинноеобучение #биотех #datascience #биоинформатика
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
А мы с радостью объявляем набор на осеннюю программу, которая стартует
Каждый запуск мы стремимся улучшить эффективность обучения. Главный плюс нашей программы — внушительный ассортимент методов и фокус на двух востребованных направлениях: ML в анализе омиксных данных и Computer Vision в биомедицине.
Курс подойдет:🔺 Биологам, биоинженерам, врачам и специалистам по данным🔺 Научным сотрудникам, аналитикам R&D, руководителям лабораторий🔺 Python-разработчикам, интересующихся задачами биоинформатики и медицины🔺 Студентам старших курсов, планирующих развитие в прикладном ML
Важно базовое владение python, хотя бы библиотеками pandas и numpy — это минимум. Невнезапный факт — чем лучше вы владеете питоном, тем легче вам на курсе.
Что вы получите за 4,5 месяца?
Формат обучения и поддержка:
Обучение проходит в гибком формате: смотрите видеолекции, когда удобно, участвуйте в прямых эфирах с преподавателями, а в чатах всегда можно задать вопрос кураторам и наставникам.
Поддержка не заканчивается с курсом — материалы и доступ к сообществу останутся с вами на целый год! 🤝
Наша фишка:
Групповая работа — она поможет вам держать динамику на протяжении всей учебы и подарит отличную компанию для встреч не только на курсе! 🤩
#openbio_ml #openbio_education #машинноеобучение #машинноеобучение #биотех #datascience #биоинформатика
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4😍3👍2
Всегда ли шум имеет гауссовское распределение?
Центральная предельная теорема говорит, что если вы суммируете много одинаково распределенных (причем по любому закону) величин, то получаете нормальное распределение. Например, в физической реальности на объект действует много случайных сил (скажем, от броуновского движения молекул и частиц). Их равнодействующая — это как раз такая сумма, поэтому распределена нормально.
Но это не всегда так. В биомедицине встречаются распределения с тяжелыми хвостами, например, распределения Леви или Парето, характерные для редких событий (экстремальных значений).
Почему важно правильно учитывать экстремальные значения?
Часто это ключевые сигналы в медицине: высокий уровень онкомаркеров → опухоль, повышенный тропонин → инфаркт, аномальные электрокардиограммы → тяжелые нарушения ритма.
Если предположить нормальность ошибок, такие показатели могут восприниматься как выбросы или ошибки измерений, а важные случаи — пропущены.
В биологических системах шум поступает из разных источников: молекулярные флуктуации, технические ошибки измерений, внешние воздействия окружающей среды и многое другое. Каждый источник имеет свою природу и характер распределения ошибок. Например, молекулярный шум часто моделируют как дискретный процесс с определенной вероятностью возникновения события (например, биномиальное или Пуассона), а технический шум — как гауссовский из-за случайных флуктуаций в электронике.
Что делать на практике?
🔷 Постройте гистограмму ошибок или остатков. Посмотрите на форму: симметрична? Есть ли тяжелые хвосты? Выбросы?
🔷 Проверьте через статистические тесты на нормальность - Шапиро-Уилка, Колмогорова-Смирнова, Андерсона-Дарлинга
🔷 Проверьте наличие тяжелых хвостов — экстремальных значений, которые реже встречаются, чем по нормальному закону. Для этого помогут графики квантиль-квантиль (Q-Q plot).
🔷 При подозрении на тяжелые хвосты — попробуйте модели с распределениями Леви, Парето, Стьюдента; для выбора оптимальной модели рассмотрите критерии выбора (AIC/BIC).
Предположение о нормальности — лишь приближение, а не догма. Ключ к точной интерпретации данных — понимание природы шума.
Сталкивались ли вы с "тяжелыми хвостами" в ваших биологических данных? Как решали эту проблему? Делитесь своим опытом в комментариях!
В следующий раз поговорим о том, как сделать надежные выводы и избежать переобучения, если данных мало.
#openbio_education
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
Центральная предельная теорема говорит, что если вы суммируете много одинаково распределенных (причем по любому закону) величин, то получаете нормальное распределение. Например, в физической реальности на объект действует много случайных сил (скажем, от броуновского движения молекул и частиц). Их равнодействующая — это как раз такая сумма, поэтому распределена нормально.
Но это не всегда так. В биомедицине встречаются распределения с тяжелыми хвостами, например, распределения Леви или Парето, характерные для редких событий (экстремальных значений).
Почему важно правильно учитывать экстремальные значения?
Часто это ключевые сигналы в медицине: высокий уровень онкомаркеров → опухоль, повышенный тропонин → инфаркт, аномальные электрокардиограммы → тяжелые нарушения ритма.
Если предположить нормальность ошибок, такие показатели могут восприниматься как выбросы или ошибки измерений, а важные случаи — пропущены.
В биологических системах шум поступает из разных источников: молекулярные флуктуации, технические ошибки измерений, внешние воздействия окружающей среды и многое другое. Каждый источник имеет свою природу и характер распределения ошибок. Например, молекулярный шум часто моделируют как дискретный процесс с определенной вероятностью возникновения события (например, биномиальное или Пуассона), а технический шум — как гауссовский из-за случайных флуктуаций в электронике.
Что делать на практике?
Предположение о нормальности — лишь приближение, а не догма. Ключ к точной интерпретации данных — понимание природы шума.
Сталкивались ли вы с "тяжелыми хвостами" в ваших биологических данных? Как решали эту проблему? Делитесь своим опытом в комментариях!
В следующий раз поговорим о том, как сделать надежные выводы и избежать переобучения, если данных мало.
#openbio_education
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13✍4👍3
Мы приглашаем всех, кто интересуется актуальными направлениями биоинформатики, биотехнологий и биомедицины, стать участником мероприятия 2025 года (с 23 по 26 сентября)!
Если вы студент, молодой ученый, исследователь или практикующий специалист до 35 лет, готовый поделиться своим опытом и новыми идеями, эта конференция для вас!
Вы сможете представить свои исследования в одной из шести актуальных секций:
Подробное описание каждой секции вы найдёте ЗДЕСЬ.
Формы участия:
✅ Отобранные тезисы будут опубликованы в сборнике конференции, размещены в научной электронной библиотеке eLIBRARY с индексацией в РИНЦ и присвоением DOI каждому тезису, допущенному до публикации в сборнике.
Хотите быть в центре научных открытий? Подать тезисы для участия в конференции можно до 1 августа 2025 года.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤1😍1
Новосибирск. Атомное и молекулярное моделирование: современные подходы и алгоритмы, Молекулярно-динамическое моделирование и его приложения, Технологии суперкомпьютерного и атомистического ML
Петрозаводск. Теоретическая часть обучения пройдет в формате лекций и семинаров? А для решения кейсов – реальных задач от партнеров – будет сформировано несколько продуктовых команд под руководством опытных наставников
Дедлайн 27 июня.
Университет ИТМО, Санкт-Петербург приглашает на воркшоп, который заканчивается решением реального кейса в формате хакатона.
Сколково, Институт науки и технологий. В программе секции по компьютерным наукам в биологии и смежным дисциплинам. Дедлайн подачи тезисов уже прошел, но можно посетить конференцию в качестве слушателя.
В Екатеринбурге, на базе Института экологии растений и животных Уральского отделения РАН пройдет конференция? в которой затронут темы эволюционные процессы с точки зрения современной генетики. Эволюционная и историческая экология; Перспективы применения новых методов генетики, геномики и селекции в решении проблем продовольственной безопасности;
Дедлайн 1 июля.
Конференция пройдет в 2 этапа: первый в сентябре, в Севастополе на базе Института перспективных исследований Севастопольского государственного университета; второй - в Москве на базе Физического факультета Московского государственного университета им. М.В. Ломоносова, в программе: Общая биофизика, Молекулярная биофизика и биоинформатика, Медицинская биофизика и биофизическая химия, Биофизическая экология.
Дедлайн 20 июля
Место проведения Наукоград Кольцово. OpenBio — крупнейший форум молодых ученых по биотеху и смежным отраслям. В программе: секции по генетике, биоинформатике, вирусологии, фундаментальной медицине и фарме.
Дедлайн 1 августа.
Онлайн-симпозиум для специалистов по компьютерному поиску и разработке лекарств, анализу биологических путей, моделированию молекул, ML и AI для фармацевтики и медицины.
Дедлайн подачи тезисов — до 31 августа, зарегистрироваться в качестве слушателя или представителя онлайн- постера можно до 25 сентября
Сколково, Институт науки и технологий.
В программе: доклады из области генетики, молекулярной биологии, метагеномики и биохимии микроорганизмов, включая трансляционную микробиологию и геномное редактирование.
Дедлайн подачи тезисов до 30 июня
Дедлайн регистрации на конференцию до 15 сентября
Институт биологии развития им. Н.К. Кольцова РАН, г. Москва проводит конференцию по сравнительной физиологии сигнальных систем, эволюции механизмов сигнализации, генетическим и эпигенетическим механизмам физиологических процессов и поведения, молекулярно-клеточным механизмам функционирования сенсорных и двигательных систем.
Дедлайн подачи тезисов 31 августа
Поделись с друзьями и посещайте мероприятия вместе!
#openbio_events #биотех #openbio_education #конференции
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3😍2
Машинное обучение в биологии и биомедицине | OpenBio.Edu
Открываем третий сезон цикла лекций «Личный путь в сеньора биоинформатика» встречей с Никитой Ваулиным. 🔬 Никита - биоинформатик и преподаватель программирования для биологов в ВШЭ и Институте биоинформатики, сейчас PhD-студент в группе Игоря Адамейко в…
Мы решили, что эфир будет проходить прямо здесь в телеграм -канале.
Вопросы можно задавать в комментариях под этим постом.
📌 Зарегистрируйтесь, если планируете смотреть встречу в записи.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍2😍1
Для команды OpenBio отзывы — это не просто слова, а фундамент для роста. Мы стремимся создавать курсы, которые по-настоящему ценны и востребованы. Рады поделиться с вами впечатлениями участников весеннего потока — это подтверждает, что мы на верном пути. Наша главная награда — видеть, как вы с удовольствием учитесь, рекомендуете нас друзьям и возвращаетесь за новыми знаниями ❤️
P.S. Кстати, завтра у нас первое повышение цен, поэтому если планировали осенью прийти к нам — самое время оставить заявку и зафиксировать текущую стоимость.
#openbio_review #openbio_education #openbio_ml
📌 Машинное обучение в биологии и биомедицине | OpenBio.Edu — подписывайтесь!
P.S. Кстати, завтра у нас первое повышение цен, поэтому если планировали осенью прийти к нам — самое время оставить заявку и зафиксировать текущую стоимость.
#openbio_review #openbio_education #openbio_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2🔥1👏1