Курс вполне оправдал мои ожидания: ко мне как главному редактору Биомолекулы обратились для рекламы еще первого потока, и я сразу подумал, что было бы круто взамен пройти курс самому. Дело в том, что я уже 20 лет занимаюсь структурной биоинформатикой и в принципе много чего знаю и умею, но вот машинное обучение и нейросети как-то оставались у меня за бортом.
После целого семестра очень интенсивных занятий, которые, не скрою, потребовали большого упорства, чтобы просто сделать всё что требовалось (посмотреть все лекции, поприсутствовать на онлайн-семинарах, сделать домашки, созвониться в группах для обсуждения решений, ну и наконец поучаствовать в соревновании на Кагл), я действительно могу сказать, что что-то начал понимать в этой сфере. Разумеется, реальный опыт еще предстоит получить, когда я применю эти знания в своих научных проектах, но теперь я уже по крайней мере буду знать, когда это стоит сделать и с какой стороны подступиться.
Понравилось, что во время курса начало формироваться некоторое сообщество людей, уже имеющих определенный опыт в конкретных сферах биоинформатики, причем не только новичков, но и уже сложившихся специалистов.
Моя благодарность команде за то, что создали этот действительно востребованный своевременный курс, далеко выходящий за рамки стандартных учебных программ: когда я сам учился в университете, методы ML в биологии еще были практически не распространены, но теперь это не так. Здорово, что появилась возможность добрать квалификацию таким образом, ведь вновь отучиться в университете 20 лет спустя уже вряд ли получится)
Также благодарю за возможность поучаствовать в этом курсе и моему сыну, без ложной скромности думаю, что это уникальный случай, когда школьник (сейчас уже выпускник и в скором времени - студент вуза) на равных участвовал во вполне взрослой программе и мог конкурировать с людьми с опытом исследовательской работы.
Если вы тоже задумывались о том, чтобы расширить свои научные горизонты с помощью машинного обучения, будем рады видеть вас среди участников! Возможно, именно ваш опыт и вопросы сделают наше сообщество ещё сильнее.
#openbio_review #openbio_education #openbio_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤6🔥3 2
В программе:
- арсенал LLM для биологии и биомедицины
- стандарты промптинга и способы сравнения моделей между собой
- наши рекомендации по внедрению LLM в учебу, в т.ч. для точечного подтягивания навыков
- схема запуска пошагового диалога с ИИ в ролевых моделях с примерами
- практические задания для отработки новых инструментов, бонусы и многое другое.
Не стесняйтесь дополнять нас в комментариях, мы хотим дать как можно больше знаний для тех, кто работает в биомед секторе и будем рады дополнениям и дискуссиям
До старта осталось менее 24 часов
OpenBio делает тренды доступными для вас
#openbio_education
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍2😍1
Добро пожаловать на наш LLM-спринт 🚀🚀🚀
Сегодня, когда всё быстро меняется, важно не просто учиться, а уметь быстро вникать в новую тему, тестировать и адаптироваться. Мы предлагаем вам в формате спринта за 5 дней сделать апгрейд в теме LLM - попробовать инструменты на практике, сравнить подходы, а лучшие идеи внедрить в работу. Поехали!
Популярные LLM
Самые популярные LLM-ки сейчас: ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google AI), Grok (xAI). Модели, доступные в России без VPN: YandexGPT, GigaChat, DeepSeek. Если вы ещё не пробовали все модели из списка - обязательно загляните.
LLM в науке: специализированные помощники
Для работы с научной литературой доступно огромное количество тулов, способных подбирать релевантные статьи, быстро вникать в новую тему, писать саммари и литобзоры и даже визуализировать связи между публикациями при помощи графов. Мы приводим самые популярные:
Elicit помогает быстро понять тему через саммари множества статей, Science.os уточнит конкретный вопрос, а AskMicrobe специализирован на микробиологических темах. Consensus даёт чёткие ответы на вопросы, приводя цитаты из статей, SciSpace и Paperguide облегчают чтение отдельных статей, выделяя самую суть. Для обзоров и построения графов научных статей полезны Connected Papers, Litmaps, Inciteful. При помощи таких графов можно визуально оценить кто и что делает в вашей научнoй теме. А Sourcely и Getliner помогают собрать текст и оформить литературный обзор.
Код-ревью работает на многих общих моделях, одна из лучших - ChatGPT o3 mini-high, но есть парочка специализированных - Cursor и Windsurf.
LLM для профессиональной работы
В отличие от привычных LLM вроде ChatGPT, которые работают "из коробки" и ориентированы на диалог, ниже мы привели специализированные инструменты для работы с биологическими последовательностями, которые нужно адаптировать под свои задачи:
✔️ DNABERT – модель на основе трансформера, предварительно обученная на последовательностях ДНК для понимания геномного «языка» с использованием токенизации k-меров. Хорошо справляется с такими задачами, как прогнозирование регуляторных элементов (промоторы, энхансеры), выявление консервативных мотивов.
✔️ GENA-LM от AIRI – набор моделей от наших соотечественников на основе трансформеров, специально разработанный для работы с длинными последовательностями ДНК. Способны обрабатывать до 36 000 пар оснований благодаря использованию механизма рекуррентной памяти (Recurrent Memory), который позволяет эффективно сохранять и использовать информацию из предыдущих фрагментов последовательности, что отличает их от DNABERT, который эффективно работает с более короткими последовательностями. Есть видеоразбор. Модель можно протестировать на Hugging Face и веб-сервере.
✔️ Evo2 – генеративная модель для синтетической биологии, в отличие от других она может генерировать новые ДНК-последовательности (например, митохондриальные и бактериальные геномы) с заданными свойствами. Потестить можно здесь.
✔️ ESM-3 (Evolutionary Scale Modeling) от Meta позволяет не только предсказывать структуру белков, но и участвовать в их дизайне, ускоряя разработку новых ферментов или терапевтических молекул. В связке с инструментом ESM Fold может использоваться прямо из коробки, без сложной настройки.
Больше bio-foundation моделей для ДНК\РНК\single cell можно найти здесь.
Делитесь ссылками с друзьями, желаем приятного погружения🔬
Завтра мы научимся сравнивать модели между собой - по качеству ответов, скорости и применимости к реальным задачам, не переключайтесь🦠
#openbio_education #openbio_LLM_Sprint
📍 Курс "Машинное обучение в биологии и биомедицине" | OpenBio.Edu — подписывайтесь!
Сегодня, когда всё быстро меняется, важно не просто учиться, а уметь быстро вникать в новую тему, тестировать и адаптироваться. Мы предлагаем вам в формате спринта за 5 дней сделать апгрейд в теме LLM - попробовать инструменты на практике, сравнить подходы, а лучшие идеи внедрить в работу. Поехали!
Популярные LLM
Самые популярные LLM-ки сейчас: ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google AI), Grok (xAI). Модели, доступные в России без VPN: YandexGPT, GigaChat, DeepSeek. Если вы ещё не пробовали все модели из списка - обязательно загляните.
LLM в науке: специализированные помощники
Для работы с научной литературой доступно огромное количество тулов, способных подбирать релевантные статьи, быстро вникать в новую тему, писать саммари и литобзоры и даже визуализировать связи между публикациями при помощи графов. Мы приводим самые популярные:
Elicit помогает быстро понять тему через саммари множества статей, Science.os уточнит конкретный вопрос, а AskMicrobe специализирован на микробиологических темах. Consensus даёт чёткие ответы на вопросы, приводя цитаты из статей, SciSpace и Paperguide облегчают чтение отдельных статей, выделяя самую суть. Для обзоров и построения графов научных статей полезны Connected Papers, Litmaps, Inciteful. При помощи таких графов можно визуально оценить кто и что делает в вашей научнoй теме. А Sourcely и Getliner помогают собрать текст и оформить литературный обзор.
Код-ревью работает на многих общих моделях, одна из лучших - ChatGPT o3 mini-high, но есть парочка специализированных - Cursor и Windsurf.
LLM для профессиональной работы
В отличие от привычных LLM вроде ChatGPT, которые работают "из коробки" и ориентированы на диалог, ниже мы привели специализированные инструменты для работы с биологическими последовательностями, которые нужно адаптировать под свои задачи:
Больше bio-foundation моделей для ДНК\РНК\single cell можно найти здесь.
Делитесь ссылками с друзьями, желаем приятного погружения
Завтра мы научимся сравнивать модели между собой - по качеству ответов, скорости и применимости к реальным задачам, не переключайтесь
#openbio_education #openbio_LLM_Sprint
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22❤8😍2🤓2