Скачиваем курсы с курсеры без регистрации и смс
Всем привет!
Может быть, напрямую не относится к теме канала, но я думаю, что проблема закрытия доступа к курсере волнует многих, поэтому делюсь способом, как можно скачать курсы оттуда.
Нашла питоновскую библиотеку: https://github.com/coursera-dl/coursera-dl которая позволяет скачивать все материалы: видео лекций, текстовые файлы, задания (правда без возможности проверить ответы).
Пара рекомендаций по установке и использованию, по крайней мере для Windows 10:
1) Лучше начинать с установки зависимостей в файле requirements.txt (команда
2) После установки зависимостей устанавливается сама программа:
3) Для корректной работы скачивания мне понадобилось создать в директории для скачивания файл-конфиг с указанием юзернейма, пароля, языка субтитров и самое главное - хеш cauth, инструкцию к нахождению которого можно найти здесь. Это что-то связанное с куками в браузере, у меня все равно не получилось выгрузить список курсов, но по крайней мере загрузка работает.
4) Скачивается конкретный курс просто:
5) Еще для корректного скачивания нужно обновить дедлайны по курсу (просто на сайте из браузера), иначе могут быть ошибки со старыми курсами, которые не до конца пройдены.
Вот примерно и все, скачивается все довольно быстро, раскладывается по папкам, есть субтитры и другие необходимые вещи, только конечно не будет проверки квизов и получения сертификатов)
Делитесь информацией с другими, что есть такой довольно легкий и удобный способ сохранить знания!
UPD: еще забросила в комменты пример конфиг файла для скачивания с английскими и русскими субтитрами
#coursera #recommendation #learn
Всем привет!
Может быть, напрямую не относится к теме канала, но я думаю, что проблема закрытия доступа к курсере волнует многих, поэтому делюсь способом, как можно скачать курсы оттуда.
Нашла питоновскую библиотеку: https://github.com/coursera-dl/coursera-dl которая позволяет скачивать все материалы: видео лекций, текстовые файлы, задания (правда без возможности проверить ответы).
Пара рекомендаций по установке и использованию, по крайней мере для Windows 10:
1) Лучше начинать с установки зависимостей в файле requirements.txt (команда
pip install -r requirements.txt, запущенная из anaconda prompt).
2) После установки зависимостей устанавливается сама программа:
pip install coursera-dl(тоже из консоли anaconda prompt).
3) Для корректной работы скачивания мне понадобилось создать в директории для скачивания файл-конфиг с указанием юзернейма, пароля, языка субтитров и самое главное - хеш cauth, инструкцию к нахождению которого можно найти здесь. Это что-то связанное с куками в браузере, у меня все равно не получилось выгрузить список курсов, но по крайней мере загрузка работает.
4) Скачивается конкретный курс просто:
coursera-dl bioinformatics, где bioinformatics название курса. Название можно посмотреть на самом сайте курса в адресной строке, написано между /learn/.../home/welcome: https://www.coursera.org/learn/bioinformatics/home/welcome
5) Еще для корректного скачивания нужно обновить дедлайны по курсу (просто на сайте из браузера), иначе могут быть ошибки со старыми курсами, которые не до конца пройдены.
Вот примерно и все, скачивается все довольно быстро, раскладывается по папкам, есть субтитры и другие необходимые вещи, только конечно не будет проверки квизов и получения сертификатов)
Делитесь информацией с другими, что есть такой довольно легкий и удобный способ сохранить знания!
UPD: еще забросила в комменты пример конфиг файла для скачивания с английскими и русскими субтитрами
#coursera #recommendation #learn
GitHub
GitHub - coursera-dl/coursera-dl: Script for downloading Coursera.org videos and naming them.
Script for downloading Coursera.org videos and naming them. - coursera-dl/coursera-dl
Пятничный мем
Поставьте себя на место менеджера балабановской спичечной фабрики, который утверждает, что количество спичек в одном коробке, выпускаемом на фабрике, варьирует в пределах 60-61 спичек.
Один из клиентов жалуется, что в недавней поставке спичек их было то 58, то 62 в одном коробке, так что вы решили взять выборку из коробков и посчитать в них спички, чтобы оценить, сколько из них соответствует стандарту.
Вы проведете двусторонний Z-критерий, чтобы проверить вашу гипотезу о том, что 95 процентов коробков соответствуют указанным стандартам.
Вопрос: какая нулевая гипотеза о том, кто же все-таки сумасшедший?
#stat_fun
Дорогие подписчики, я все еще готовлю пост о разборе программы статистика, но разбор оказался сложнее, чем я думала, надеюсь за выходные успею закончить.
Поставьте себя на место менеджера балабановской спичечной фабрики, который утверждает, что количество спичек в одном коробке, выпускаемом на фабрике, варьирует в пределах 60-61 спичек.
Один из клиентов жалуется, что в недавней поставке спичек их было то 58, то 62 в одном коробке, так что вы решили взять выборку из коробков и посчитать в них спички, чтобы оценить, сколько из них соответствует стандарту.
Вы проведете двусторонний Z-критерий, чтобы проверить вашу гипотезу о том, что 95 процентов коробков соответствуют указанным стандартам.
Вопрос: какая нулевая гипотеза о том, кто же все-таки сумасшедший?
#stat_fun
Дорогие подписчики, я все еще готовлю пост о разборе программы статистика, но разбор оказался сложнее, чем я думала, надеюсь за выходные успею закончить.
Долгожданный разбор программы Statistica готов!
Ознакомиться можно по ссылке:
https://telegra.ph/Razbor-programmy-Statistica-04-28
Когда я его задумывала, ни за что бы не предположила, что уйдет почти два месяца на разбор, понимание и написание. Более того, оказалось, что часть вещей не удалось осветить, чтобы не перегружать текст еще больше, поэтому это останется на другой раз, например, когда буду разбирать суть двухфакторного дисперсионного анализа (ановы).
Пожалуйста, распространяйте по своим чатам, пишите комментарии, замечания, мне бы очень хотелось, чтобы как можно больше людей ознакомились с разбором.
Скоро будет простой пост о недостатках среднего и стандартного отклонения как мер центральной тенденции и разброса, так что не переключайтесь.
#stat_hard #analysis
Ознакомиться можно по ссылке:
https://telegra.ph/Razbor-programmy-Statistica-04-28
Когда я его задумывала, ни за что бы не предположила, что уйдет почти два месяца на разбор, понимание и написание. Более того, оказалось, что часть вещей не удалось осветить, чтобы не перегружать текст еще больше, поэтому это останется на другой раз, например, когда буду разбирать суть двухфакторного дисперсионного анализа (ановы).
Пожалуйста, распространяйте по своим чатам, пишите комментарии, замечания, мне бы очень хотелось, чтобы как можно больше людей ознакомились с разбором.
Скоро будет простой пост о недостатках среднего и стандартного отклонения как мер центральной тенденции и разброса, так что не переключайтесь.
#stat_hard #analysis
Telegraph
Разбор программы Statistica
Навигация для удобства чтения: -Знакомство с программой-Анализ-Выводы Устав от многочисленных вопросов, а чем же конкретно плоха программа Statistica, и почему стоит использовать языки программирования (например, R и Pyhton) для статистических расчетов, я…
Предложение подработки для тех кто разбирается в статистике и R от Бластима.
По вопросам можно писать @korzhks
Я сама тоже записалась на помощь с проведением очных занятий в Москве, посмотрим как пройдет, пока мне очень нравится идея и программа занятий у ребят от Бластима.
А также еще не поздно записаться на саму программу, есть возможность очного и онлайн участия
Для тех, кто разбирается в R, статистике и анализе данных также есть возможность онлайн подработки в даты с 27 июня — 7 июля по будням (9 дней) с 10:00 до 18:30. Нужно будет помогать людям преодолеть страх перед кодингом и освоить язык программирования R :)
По вопросам можно писать @korzhks
Я сама тоже записалась на помощь с проведением очных занятий в Москве, посмотрим как пройдет, пока мне очень нравится идея и программа занятий у ребят от Бластима.
А также еще не поздно записаться на саму программу, есть возможность очного и онлайн участия
agency.blastim.ru
Курс: «Статистика, R и анализ данных»
Этот курс подойдет для ученых, врачей, агротех-специалистов, аналитиков всех интересующихся переобучением на Data Scientista.
Отзыв о курсе бластим по анализу данных в R
Я съездила на курсы в Москву в качестве технического ассистента, суть работы в том, чтобы помогать участникам, когда у них отвалится очередной R пакет при установке, не будет работать какая-то функция и другие подобные вещи. Сказать по правде, я и так в рабочее (и иногда в нерабочее) время постоянно помогаю коллегам и друзьям с отвалившимися пакетами, так что было приятно, что за это еще и платят. Сам курс был организован на высоком техническом уровне, лектор был онлайн, была очная аудитория и онлайн участники. Я помогала преимущественно в зале, но и в онлайне тоже, когда успевала отвечать.
Для меня было полезным подтянуть и систематизировать кое-какие вещи про R, например наконец-то перестать гуглить каждый раз
Атмосфера на курсах была очень классной, познакомилась с кучей крутых ребят, заценила сидрерию в Москве.
Однозначно рада проведенному времени и могу порекомендовать курс к участию, особенно для среднего уровня (для совсем новичка возможно будет тяжеловато). А если вы уже разбираетесь в статистике и R, то советую посетить курс как технический ассистент, очень любопытный опыт.
По моему мнению, курс преимущественно настроен на все-таки ненулевой опыт, например, даже поверхностное знание другого языка программирования уже будет ненулевым уровнем. Мне показалось, что небольшой опыт работы в R и/или с другим языком программирования очень способствовал эффективному обучению, поскольку совсем с нулевым бэкграундом, возможно, было тяжеловато. Продвинутые вещи тоже разбирались, но боюсь, что они могли эффективно усвоиться при знании, что такое бывает (например, Бокс-Кокс трансформация). Но наверное, суть в том, что даже если при прохождении курса часть вещей не воспринялась, то по крайней мере появилось понимание, какие продвинутые темы в статистике и R бывают, и поскольку доступ к материалам сохраняется, никто не помешает вернуться к этому, когда уже будет необходимость.
Возможно, с предыдущим абзацем могут не согласиться остальные преподаватели, но я так считаю, исходя из опыта общения с участниками. Кто из участников читает, напишите в комментариях, что думаете по этому поводу.
А еще в процессе курса я вспомнила один смешной момент. Я в апреле ездила на курсы Сириуса, где преподавала математическое моделирование, и на семинаре я использовала R-пакет для генерации паттернов Тьюринга. И естественно, все пакеты отвалились при установке у половины участников и мне понадобилось вручную починить их, я в шутку заметила, что могла бы вести курсы по установке пакетов в R. Ну и так и случилось. Но, конечно, курсы по установке пакетов это уже чересчур, хотя я например считаю, что у нас в НГУ не хватает курса по R. Однако, это уже тема для отдельного обсуждения, с начальством)
В общем, курс от бластима я рекомендую, если есть вопросы, пишите
#feedback #recommendation #blastim
Я съездила на курсы в Москву в качестве технического ассистента, суть работы в том, чтобы помогать участникам, когда у них отвалится очередной R пакет при установке, не будет работать какая-то функция и другие подобные вещи. Сказать по правде, я и так в рабочее (и иногда в нерабочее) время постоянно помогаю коллегам и друзьям с отвалившимися пакетами, так что было приятно, что за это еще и платят. Сам курс был организован на высоком техническом уровне, лектор был онлайн, была очная аудитория и онлайн участники. Я помогала преимущественно в зале, но и в онлайне тоже, когда успевала отвечать.
Для меня было полезным подтянуть и систематизировать кое-какие вещи про R, например наконец-то перестать гуглить каждый раз
how to reshape data from wide to long format R
(правда, я еще не успела проверить, но думаю, что с синтаксисом pivot_longer
/pivot_wider
у меня больше не будет таких проблем). Атмосфера на курсах была очень классной, познакомилась с кучей крутых ребят, заценила сидрерию в Москве.
Однозначно рада проведенному времени и могу порекомендовать курс к участию, особенно для среднего уровня (для совсем новичка возможно будет тяжеловато). А если вы уже разбираетесь в статистике и R, то советую посетить курс как технический ассистент, очень любопытный опыт.
По моему мнению, курс преимущественно настроен на все-таки ненулевой опыт, например, даже поверхностное знание другого языка программирования уже будет ненулевым уровнем. Мне показалось, что небольшой опыт работы в R и/или с другим языком программирования очень способствовал эффективному обучению, поскольку совсем с нулевым бэкграундом, возможно, было тяжеловато. Продвинутые вещи тоже разбирались, но боюсь, что они могли эффективно усвоиться при знании, что такое бывает (например, Бокс-Кокс трансформация). Но наверное, суть в том, что даже если при прохождении курса часть вещей не воспринялась, то по крайней мере появилось понимание, какие продвинутые темы в статистике и R бывают, и поскольку доступ к материалам сохраняется, никто не помешает вернуться к этому, когда уже будет необходимость.
Возможно, с предыдущим абзацем могут не согласиться остальные преподаватели, но я так считаю, исходя из опыта общения с участниками. Кто из участников читает, напишите в комментариях, что думаете по этому поводу.
А еще в процессе курса я вспомнила один смешной момент. Я в апреле ездила на курсы Сириуса, где преподавала математическое моделирование, и на семинаре я использовала R-пакет для генерации паттернов Тьюринга. И естественно, все пакеты отвалились при установке у половины участников и мне понадобилось вручную починить их, я в шутку заметила, что могла бы вести курсы по установке пакетов в R. Ну и так и случилось. Но, конечно, курсы по установке пакетов это уже чересчур, хотя я например считаю, что у нас в НГУ не хватает курса по R. Однако, это уже тема для отдельного обсуждения, с начальством)
В общем, курс от бластима я рекомендую, если есть вопросы, пишите
#feedback #recommendation #blastim
Компания RStudio переименовывается в posit
Вчера на rstudioconf было анонсировано, что компания RStudio (именно компания, IDE RStudio сохранит прежнее название) меняет название на posit, чтобы больше привлекать пользователей/разработчиков других языков программирования, в частности Python, Julia. Сначала мне показалось, что сами создатели арстудио и тайдиверса и много чего еще открещиваются от языка, но тогда я думала, что еще и IDE переименуют, а оказалось, что только компанию. Может, это и неплохой ход, чтобы привлечь больше программистов, чтобы не было связи с R в названии. Но пока меня это все равно скорее огорчает, посмотрим, насколько позитивно скажется переименовывание.
Кроме того, анонсировали shiny для python. Для меня это не так важно, потому что я еще собираюсь освоить shiny для R, даже недавно купила бумажную книгу Mastering Shiny в переводе Александра Гинько. Но в целом это здорово, насколько мне известно, до настоящего момента не было аналогов shiny для питона. Небольшое пояснение: shiny - это пакет для создания веб-приложений, веб-страниц напрямую из R. Для биологов/биоинформатиков мне очень например нравится idep и shinyGO для анализа дифференциальной экспрессии данных RNA-seq и функциональной аннотации, соответственно. Здесь реализованы очень классные вещи с точки зрения анализа, и это очень классный пример того, зачем нужны shiny apps.
Пока из показавшихся мне важными новостей rstudioconf все, можно следить в твиттере по хештегу, а также на сайте самой конференции.
#R
Вчера на rstudioconf было анонсировано, что компания RStudio (именно компания, IDE RStudio сохранит прежнее название) меняет название на posit, чтобы больше привлекать пользователей/разработчиков других языков программирования, в частности Python, Julia. Сначала мне показалось, что сами создатели арстудио и тайдиверса и много чего еще открещиваются от языка, но тогда я думала, что еще и IDE переименуют, а оказалось, что только компанию. Может, это и неплохой ход, чтобы привлечь больше программистов, чтобы не было связи с R в названии. Но пока меня это все равно скорее огорчает, посмотрим, насколько позитивно скажется переименовывание.
Кроме того, анонсировали shiny для python. Для меня это не так важно, потому что я еще собираюсь освоить shiny для R, даже недавно купила бумажную книгу Mastering Shiny в переводе Александра Гинько. Но в целом это здорово, насколько мне известно, до настоящего момента не было аналогов shiny для питона. Небольшое пояснение: shiny - это пакет для создания веб-приложений, веб-страниц напрямую из R. Для биологов/биоинформатиков мне очень например нравится idep и shinyGO для анализа дифференциальной экспрессии данных RNA-seq и функциональной аннотации, соответственно. Здесь реализованы очень классные вещи с точки зрения анализа, и это очень классный пример того, зачем нужны shiny apps.
Пока из показавшихся мне важными новостей rstudioconf все, можно следить в твиттере по хештегу, а также на сайте самой конференции.
#R
Posit
RStudio is becoming Posit - Posit
We are very excited to announce that RStudio has a new name, Posit.
Каким образом вы импортируете и экспортируете файлы в R?
Anonymous Poll
22%
В начале скрипта меняю рабочую директорию`setwd('C:/Users/user/path/to/project')`
36%
Использую абсолютные пути к файлам `read.csv(('C:/Users/user/path/to/project/data.csv')`
29%
Использую проекты в RStudio
12%
Загружаю данные с помощью Import Dataset
23%
Не использую R
Советы для эффективной организации работы в R
Опрос показал, что очень малый процент подписчиков использует проекты в RStudio (19%), это меньше чем процент людей, не пользующихся R (23%).
Поэтому я написала небольшой пост с набором рекомендаций о работе в R.
https://telegra.ph/R-how-to-organize-work-08-08
Об этом к сожалению не всегда рассказывают на курсах, например ар-проекты я начала применять спустя 5 лет после начала работы с R (стыдно признать).
Также собрала лайфхаки для удобной работы и ссылки, чтобы двигаться в правильном направлении.
Бонусом презентация о правильном наименовании файлов, которая будет полезна вообще всем, не только пользователям R.
И еще я обновила рекомендуемую литературу по R классной книгой Ивана, которая к тому же на русском языке. Очень радует, что русскоязычное R-сообщество развивается и появляются книги, посвященные языку!
#R #lifehack #literature
Опрос показал, что очень малый процент подписчиков использует проекты в RStudio (19%), это меньше чем процент людей, не пользующихся R (23%).
Поэтому я написала небольшой пост с набором рекомендаций о работе в R.
https://telegra.ph/R-how-to-organize-work-08-08
Об этом к сожалению не всегда рассказывают на курсах, например ар-проекты я начала применять спустя 5 лет после начала работы с R (стыдно признать).
Также собрала лайфхаки для удобной работы и ссылки, чтобы двигаться в правильном направлении.
Бонусом презентация о правильном наименовании файлов, которая будет полезна вообще всем, не только пользователям R.
И еще я обновила рекомендуемую литературу по R классной книгой Ивана, которая к тому же на русском языке. Очень радует, что русскоязычное R-сообщество развивается и появляются книги, посвященные языку!
#R #lifehack #literature
Telegraph
Эффективно организуем работу в R
Сегодня хочу рассказать небольшие тонкости для качественной организации работы с R в IDE RStudio. Организация проектов в RStudio Первым делом, что нужно освоить для эффективной работы - это перестать использовать setwd("C:\Users\username\path\that\only\I\have")…
Вчера был день рождения у автора канала - Лены. Лена выбрала крутую тему и интересно её раскрывает, особенно классно смотреть не только на авторские тексты, но и рисунки :D А ещё с Леной круто играть в Нечто. И ездить куда-нибудь с рюкзаком. У Лены вообще много интересного можно узнать и это прикольно!
Лена, удачи тебе с реализацией твоих таких разных проектов! И успехов в эффективном донесении своих идей до любой аудитории:)
Лена, удачи тебе с реализацией твоих таких разных проектов! И успехов в эффективном донесении своих идей до любой аудитории:)
Рада представить обновленную программу репетиторства по статистике, R и обработке данных RNA-seq для студентов, научных сотрудников и любых желающих
Цена: 2500 рублей в час (астрономический)
Формат: в основном онлайн, однако для местных желающих можно подумать об организации очных занятий
Студентам скидка 10%
Возможно как изучение интересующих вас тем, так и занятия по программе, приведенной ниже.
В любом случае гарантируется индивидуальный подход к каждому ученику, с учетом бэкграунда и необходимых к изучению тем
Обо мне:
Я закончила бакалавриат и магистратуру факультета естественных наук НГУ, работаю младшим научным сотрудником в институте цитологии и генетики в секторе системной биологии морфогенеза растений. Сейчас на третьем курсе аспирантуры по направлению биоинформатики.
Опыт работы в R: с ~2017 года, тогда же начала изучать статистику, однако скажу честно, что действительно продвинулась в изучении в последние два-три года.
Вообще я конечно очень люблю R, как многие могли заметить, и стремлюсь передать это остальным.
Преподавательский опыт:
* Преподаю семинары по компьютерной транскриптомике (обработке данных RNA-seq) для магистрантов НГУ (ссылочка на программу здесь)
* Работала техническим ассистентом на курсе бластим "Статистика, R и анализ данных", впечатления можно почитать здесь
* В течение последних двух лет консультирую коллег и друзей по вопросам статистики, уже проводила индивидуальные занятия, в основном статистику для медиков, также консультировала по обработке RNA-seq, за отзывами можно к Тане
* Вела кураторские занятия по дифференциальным уравнениям для студентов 2 курса
* Преподавала в летней физматшколе биологию для учеников 10 класса
Приблизительные темы занятий:
* базовый R, считывание данных, препроцессинг, проведение статистических тестов (параметрических, непараметрических), построение графиков (ggplot2)
* tidyverse, а именно использование dplyr, пайпов, stringr для работы со строками, а также purrr для замены циклов и функций семейства apply
* базовая статистика: теория, лежащая в основе статистических тестов, понимание области применения тестов и их ограничения (например у параметрических)
* продвинутая статистика: применение перестановочных тестов как альтернатива классическим
* пайплайн обработки данных RNA-seq: от сырых данных с прибора до списка дифференциально экспрессирующихся генов и дальнейший анализ этих списков
В рамках этих тем почти все на ваш выбор, кроме пожалуй data.table и shiny по R (еще сама изучаю), а также линейных моделей со смешанными эффектами (пока не чувствую компетенции это преподавать).
Обратите внимание! В этот раз НЕ подразумевается формат решения за вас учебных/рабочих задач, я теперь только за обучение, а не за решение вместо.
Пишите по вопросам лично или в комментарии к этому посту, записываться на занятия в личные сообщения.
Еще буду благодарна, если раскидаете по чатам тем, кому это может быть интересно
#R #stat #RNA-seq
Цена: 2500 рублей в час (астрономический)
Формат: в основном онлайн, однако для местных желающих можно подумать об организации очных занятий
Студентам скидка 10%
Возможно как изучение интересующих вас тем, так и занятия по программе, приведенной ниже.
В любом случае гарантируется индивидуальный подход к каждому ученику, с учетом бэкграунда и необходимых к изучению тем
Обо мне:
Я закончила бакалавриат и магистратуру факультета естественных наук НГУ, работаю младшим научным сотрудником в институте цитологии и генетики в секторе системной биологии морфогенеза растений. Сейчас на третьем курсе аспирантуры по направлению биоинформатики.
Опыт работы в R: с ~2017 года, тогда же начала изучать статистику, однако скажу честно, что действительно продвинулась в изучении в последние два-три года.
Вообще я конечно очень люблю R, как многие могли заметить, и стремлюсь передать это остальным.
Преподавательский опыт:
* Преподаю семинары по компьютерной транскриптомике (обработке данных RNA-seq) для магистрантов НГУ (ссылочка на программу здесь)
* Работала техническим ассистентом на курсе бластим "Статистика, R и анализ данных", впечатления можно почитать здесь
* В течение последних двух лет консультирую коллег и друзей по вопросам статистики, уже проводила индивидуальные занятия, в основном статистику для медиков, также консультировала по обработке RNA-seq, за отзывами можно к Тане
* Вела кураторские занятия по дифференциальным уравнениям для студентов 2 курса
* Преподавала в летней физматшколе биологию для учеников 10 класса
Приблизительные темы занятий:
* базовый R, считывание данных, препроцессинг, проведение статистических тестов (параметрических, непараметрических), построение графиков (ggplot2)
* tidyverse, а именно использование dplyr, пайпов, stringr для работы со строками, а также purrr для замены циклов и функций семейства apply
* базовая статистика: теория, лежащая в основе статистических тестов, понимание области применения тестов и их ограничения (например у параметрических)
* продвинутая статистика: применение перестановочных тестов как альтернатива классическим
* пайплайн обработки данных RNA-seq: от сырых данных с прибора до списка дифференциально экспрессирующихся генов и дальнейший анализ этих списков
В рамках этих тем почти все на ваш выбор, кроме пожалуй data.table и shiny по R (еще сама изучаю), а также линейных моделей со смешанными эффектами (пока не чувствую компетенции это преподавать).
Обратите внимание! В этот раз НЕ подразумевается формат решения за вас учебных/рабочих задач, я теперь только за обучение, а не за решение вместо.
Пишите по вопросам лично или в комментарии к этому посту, записываться на занятия в личные сообщения.
Еще буду благодарна, если раскидаете по чатам тем, кому это может быть интересно
#R #stat #RNA-seq
Приветствую подписчиков, особенно новоприбывших!
Я подготовила инструкцию, как установить и настроить R и RStudio для разных операционных систем.
https://ubogoeva.github.io/R4Analytics/posts/how_to_install_R.html
Инструкция будет полезна для тех, кто только начинает знакомство с этим языком программирования, а также для того чтобы скидывать студентам на курсах)
По своему преподавательскому опыту знаю, что нередко возникают проблемы с установкой библиотек на Ubuntu и с кириллическими путями в Windows, разобрала, что нужно сделать, чтобы это исправить.
Пишите, сталкивались ли вы с подобными или другими сложностями в начале освоения R.
P.S. А еще я научилась наконец-то делать странички на гитхабе и вообще интегрировать Git + R в RStudio
#R #install
Я подготовила инструкцию, как установить и настроить R и RStudio для разных операционных систем.
https://ubogoeva.github.io/R4Analytics/posts/how_to_install_R.html
Инструкция будет полезна для тех, кто только начинает знакомство с этим языком программирования, а также для того чтобы скидывать студентам на курсах)
По своему преподавательскому опыту знаю, что нередко возникают проблемы с установкой библиотек на Ubuntu и с кириллическими путями в Windows, разобрала, что нужно сделать, чтобы это исправить.
Пишите, сталкивались ли вы с подобными или другими сложностями в начале освоения R.
P.S. А еще я научилась наконец-то делать странички на гитхабе и вообще интегрировать Git + R в RStudio
#R #install
Всем добрый вечер! Материалов на какую тему хотелось бы видеть больше на канале?
Опрос мультивариантный
Опрос мультивариантный
Anonymous Poll
58%
Базовая статистика (что такое p-value, описательные статистики, статистический вывод)
55%
Продвинутая статистика (ановы, поправки на множественное тестирование, линейные модели)
30%
Базовый R, история языка, особенности
32%
Построение графиков, ggplot2
31%
tidyverse как набор пакетов для анализа данных, с акцентом на dplyr и purrr
0%
Другое (пишите в комментарии)
Всем привет!
Кто хочет подтянуть знания по статистике и научиться круче анализировать данные в R, рекомендую 9-дневный курс-интенсив "Статистика R и анализ данных" от бластима, начнется 31 октября. Участвовать можно очно (в Москве) или онлайн, оба формата оказались достаточно эффективными.
Но сразу скажу, что если вы будете участвовать онлайн, то готовьтесь, что курсу нужно будет посвящать целый рабочий день, параллельно работать скорее всего не получится. Однако если что-то не успеете посмотреть сразу, организаторы предоставляют неограниченный доступ к видеозаписям курса, так что можно будет пройти в удобное время. Хотя конечно одним из преимуществ таких курсов является возможность задать вопросы лектору, поэтому рекомендую все-таки найти время на полноценное прохождение курса.
⚡️По промокоду ELENASTATR15 можно получить 15% скидку!
Я сама участвовала как технический ассистент в прошлый раз и могу гарантировать, что каждому участнику уделяется достаточно много внимания и помощи в решении конкретно ваших задач. Лектор Иван Поздняков очень крутой, объясняет все максимально понятными словами, с кучей примеров + используя реальные датасеты.
В программе R разбирается с нуля, что подойдет для совсем новичков в программировании, но лектор также рассказывает тонкости и фишки языка R, примерно на уровне Advanced R, что будет интересно и тем, кто более-менее разбирается в R (знаю по своему опыту).
Мне еще нравится в курсе, что почти сразу происходит погружение в
В части по статистике делается акцент на понимании основ статистического вывода и связи методов друг с другом, а также различных тонких моментах применения различных методов. Кто уже пробовал применять статистические тесты в R, наверняка знает, что запускаются они обычно в одну строчку, но сложность заключается в правильной подготовке данных и интерпретации результатов.
Разбор статистики начинается с основ статистического вывода и самых простых тестов (тест Стьюдента например), а заканчивается линейными моделями, методами понижения размерности и другими достаточно серьезными методами. Так что если вы уже не совсем новичок в статистике, но хотите продвинуться в освоении более сложных методов, добро пожаловать на курс!
В этот раз я тоже буду участвовать как технический ассистент онлайн, буду помогать с установкой пакетов, запуском функций и вообще)
Если есть вопросы, пишите в личку
P.S. Основываясь на результатах опроса, я уже готовлю пост по базовой статистике, выйдет в ближайшие несколько дней.
P.P.S. Если не хватает времени на курс, то можно записаться ко мне на индивидуальные занятия, подробности тут.
Кто хочет подтянуть знания по статистике и научиться круче анализировать данные в R, рекомендую 9-дневный курс-интенсив "Статистика R и анализ данных" от бластима, начнется 31 октября. Участвовать можно очно (в Москве) или онлайн, оба формата оказались достаточно эффективными.
Но сразу скажу, что если вы будете участвовать онлайн, то готовьтесь, что курсу нужно будет посвящать целый рабочий день, параллельно работать скорее всего не получится. Однако если что-то не успеете посмотреть сразу, организаторы предоставляют неограниченный доступ к видеозаписям курса, так что можно будет пройти в удобное время. Хотя конечно одним из преимуществ таких курсов является возможность задать вопросы лектору, поэтому рекомендую все-таки найти время на полноценное прохождение курса.
⚡️По промокоду ELENASTATR15 можно получить 15% скидку!
Я сама участвовала как технический ассистент в прошлый раз и могу гарантировать, что каждому участнику уделяется достаточно много внимания и помощи в решении конкретно ваших задач. Лектор Иван Поздняков очень крутой, объясняет все максимально понятными словами, с кучей примеров + используя реальные датасеты.
В программе R разбирается с нуля, что подойдет для совсем новичков в программировании, но лектор также рассказывает тонкости и фишки языка R, примерно на уровне Advanced R, что будет интересно и тем, кто более-менее разбирается в R (знаю по своему опыту).
Мне еще нравится в курсе, что почти сразу происходит погружение в
tidyverse
, как я уже упоминала, это набор пакетов для анализа данных, объединенных общей философией и подходом. Ну и в целом, считается, что в R без тайдиверса сейчас особо делать нечего.В части по статистике делается акцент на понимании основ статистического вывода и связи методов друг с другом, а также различных тонких моментах применения различных методов. Кто уже пробовал применять статистические тесты в R, наверняка знает, что запускаются они обычно в одну строчку, но сложность заключается в правильной подготовке данных и интерпретации результатов.
Разбор статистики начинается с основ статистического вывода и самых простых тестов (тест Стьюдента например), а заканчивается линейными моделями, методами понижения размерности и другими достаточно серьезными методами. Так что если вы уже не совсем новичок в статистике, но хотите продвинуться в освоении более сложных методов, добро пожаловать на курс!
В этот раз я тоже буду участвовать как технический ассистент онлайн, буду помогать с установкой пакетов, запуском функций и вообще)
Если есть вопросы, пишите в личку
P.S. Основываясь на результатах опроса, я уже готовлю пост по базовой статистике, выйдет в ближайшие несколько дней.
P.P.S. Если не хватает времени на курс, то можно записаться ко мне на индивидуальные занятия, подробности тут.
agency.blastim.ru
Курс: «Статистика, R и анализ данных»
Этот курс подойдет для ученых, врачей, агротех-специалистов, аналитиков всех интересующихся переобучением на Data Scientista.
Квартет Энскомба (Anscombe's) или важность визуализации данных перед началом анализа
Подготовила небольшую статью о таком любопытном наборе данных, который показывает что нужно опираться не только на средние-стандартные отклонения, но и точно знать, что происходит в данных, опираясь на визуализацию.
https://rpubs.com/lena_astr/958484
Бонусом список ссылок на книги и статьи по качественному представлению данных.
Попробовала сделать свой первый документ на quarto, пока полет нормальный, но почему-то на github pages слетело форматирование, поэтому пока залила на rpubs.
Конечно, не всегда можно так легко отразить на одном или нескольких графиках, что происходит в данных. Так что о способах визуализировать многомерные данные, например данные экспрессии генов, поговорим в следующий раз.
#R #base_stat
Подготовила небольшую статью о таком любопытном наборе данных, который показывает что нужно опираться не только на средние-стандартные отклонения, но и точно знать, что происходит в данных, опираясь на визуализацию.
https://rpubs.com/lena_astr/958484
Бонусом список ссылок на книги и статьи по качественному представлению данных.
Попробовала сделать свой первый документ на quarto, пока полет нормальный, но почему-то на github pages слетело форматирование, поэтому пока залила на rpubs.
Конечно, не всегда можно так легко отразить на одном или нескольких графиках, что происходит в данных. Так что о способах визуализировать многомерные данные, например данные экспрессии генов, поговорим в следующий раз.
#R #base_stat
Супер крутая инструкция по освоению библиотеки purrr для замены циклов
Немного контекста: в R принято обходиться не то чтоб без вложенных циклов, а без циклов вообще. Как это реализуется? Большинство функций в R векторизованы, что означает, что функция будет работать со всеми элементами вектора без необходимости проходить цикл и обрабатывать каждый элемент по одному.
Простейший пример векторизации - возвести числа от 1 до 10 в квадрат. Классическим подходом было бы написать цикл от 1 до 10 и возвести в квадрат каждый элемент. Однако в R это можно сделать гораздо проще!
Мы просто взяли вектор чисел от 1 до 10 и возвели в квадрат одной строчкой без всяких циклов. Это самый простой прием, для более сложных пригодятся функции семейства
Пример из жизни применения map функции. У меня много однотипных датасетов в определенной директории с одним расширением (например csv). Задача считать все датасеты в один лист для последующих манипуляций с ними. Чтобы не писать цикл, используем
ИЛИ
, если без синтаксического сахара, а использовать более привычный apply-способ
Вообще на тему функционального программирования в R, векторизации и сравнения *apply и map_* функций можно довольно много что расписать, если есть интерес к этой теме, ставьте реакцию с китом (потому что с котом еще нет реакций, а символ purrr - котик).
#R #tidyverse #purrr
Немного контекста: в R принято обходиться не то чтоб без вложенных циклов, а без циклов вообще. Как это реализуется? Большинство функций в R векторизованы, что означает, что функция будет работать со всеми элементами вектора без необходимости проходить цикл и обрабатывать каждый элемент по одному.
Простейший пример векторизации - возвести числа от 1 до 10 в квадрат. Классическим подходом было бы написать цикл от 1 до 10 и возвести в квадрат каждый элемент. Однако в R это можно сделать гораздо проще!
(1:10)**2
[1] 1 4 9 16 25 36 49 64 81 100
Мы просто взяли вектор чисел от 1 до 10 и возвели в квадрат одной строчкой без всяких циклов. Это самый простой прием, для более сложных пригодятся функции семейства
apply
или их более продвинутый аналог функции семейства map_*, map2_*
из библиотеки purrr
. Именно последним посвящен туториал, скачать который можно по ссылке.Пример из жизни применения map функции. У меня много однотипных датасетов в определенной директории с одним расширением (например csv). Задача считать все датасеты в один лист для последующих манипуляций с ними. Чтобы не писать цикл, используем
purrr::map
library(tidyverse)
csv_file_names <- dir(pattern = 'csv')
list_csv <- map(csv_file_names, ~read_csv(.x))
ИЛИ
list_csv <- map(csv_file_names, function(x) read_csv(x))
, если без синтаксического сахара, а использовать более привычный apply-способ
Вообще на тему функционального программирования в R, векторизации и сравнения *apply и map_* функций можно довольно много что расписать, если есть интерес к этой теме, ставьте реакцию с китом (потому что с котом еще нет реакций, а символ purrr - котик).
#R #tidyverse #purrr
Пределы погрешностей: что это, зачем использовать и как интерпретировать?
Продолжаем тему базовой статистики (кстати базовой не значит простой). Рада представить разбор видов error bar, их различий и правильной интерпретации:
https://ubogoeva.github.io/R4Analytics/posts/types_of_error_bars.html
Тема оказалась сложнее, чем я рассчитывала, например, я сама не знала что пределы погрешностей существуют двух принципиально разных типов. Но думаю получилось интересно, по крайней мере мне точно было интересно писать. В этот раз сверстала в Rmd файл, с quarto пока не разобралась, почему на github pages размещается некрасиво.
Бонусом альтернативные способы визуализации данных. Прикрепляю еще небольшой тизер к посту, очень нравится получившаяся картинка.
Пишите комментарии, какие виды error bar используете для представления своих данных, сталкивались ли с их неправильной интерпретацией и понравились ли предложенные способы визуализации?
#base_stat #R #ggplot2 #data_vis
Продолжаем тему базовой статистики (кстати базовой не значит простой). Рада представить разбор видов error bar, их различий и правильной интерпретации:
https://ubogoeva.github.io/R4Analytics/posts/types_of_error_bars.html
Тема оказалась сложнее, чем я рассчитывала, например, я сама не знала что пределы погрешностей существуют двух принципиально разных типов. Но думаю получилось интересно, по крайней мере мне точно было интересно писать. В этот раз сверстала в Rmd файл, с quarto пока не разобралась, почему на github pages размещается некрасиво.
Бонусом альтернативные способы визуализации данных. Прикрепляю еще небольшой тизер к посту, очень нравится получившаяся картинка.
Пишите комментарии, какие виды error bar используете для представления своих данных, сталкивались ли с их неправильной интерпретацией и понравились ли предложенные способы визуализации?
#base_stat #R #ggplot2 #data_vis
Как задать хороший вопрос в R чате?
Для русскоязычного R-комьюнити есть два больших чата: R (язык программирования) и Горячая линия R. Вообще правила прописаны в закрепленных постах чатов, но я бы хотела поделиться своим опытом задавания вопросов и создания воспроизводимых примеров (reprex, репрекс).
Reprex (reproducible example) - это минимальный пример кода, воспроизводящий ошибку или описывающий, что требуется сделать.
Такой пример кода удобно копируется в чат с соответствующим форматированием, его легко читать и можно сразу же скопировать себе, чтобы попробовать помочь.
У меня не поместилось все в лимит символов в телеграме, поэтому как всегда ссылка на гитхаб:
https://ubogoeva.github.io/R_question_how_to_ask.html
Надеюсь, будет полезно и повысит культуру общения в чатах)
#R #help
Для русскоязычного R-комьюнити есть два больших чата: R (язык программирования) и Горячая линия R. Вообще правила прописаны в закрепленных постах чатов, но я бы хотела поделиться своим опытом задавания вопросов и создания воспроизводимых примеров (reprex, репрекс).
Reprex (reproducible example) - это минимальный пример кода, воспроизводящий ошибку или описывающий, что требуется сделать.
Такой пример кода удобно копируется в чат с соответствующим форматированием, его легко читать и можно сразу же скопировать себе, чтобы попробовать помочь.
У меня не поместилось все в лимит символов в телеграме, поэтому как всегда ссылка на гитхаб:
https://ubogoeva.github.io/R_question_how_to_ask.html
Надеюсь, будет полезно и повысит культуру общения в чатах)
#R #help
Рисуем дорожные знаки в R
Наткнулась на пост в линкедине, где автор (профессор Nuno Sepúlveda) интересовался, из какого распределения пришел дорожный знак лежачий полицейский. Мне показалось забавным, и я воспроизвела код для этого знака, а еще попробовала нарисовать знак "Неровная дорога" в R, опираясь на похожую идею.
https://ubogoeva.github.io/road_signs_r.html
Пост шуточный, пока думаю, про что писать дальше, предлагайте в комментариях.
#R #stat_fun
Наткнулась на пост в линкедине, где автор (профессор Nuno Sepúlveda) интересовался, из какого распределения пришел дорожный знак лежачий полицейский. Мне показалось забавным, и я воспроизвела код для этого знака, а еще попробовала нарисовать знак "Неровная дорога" в R, опираясь на похожую идею.
https://ubogoeva.github.io/road_signs_r.html
Пост шуточный, пока думаю, про что писать дальше, предлагайте в комментариях.
#R #stat_fun
Подборка и небольшой обзор нейросетей для написания кода на R
- Начнем с всем известной chatGPT3. Вообще история общения с этой нейросетью получилась интересная, потому что сначала я допытывала определение p-value, на что сеть отвечала набором неправильных интерпретаций почти как из справочника "чем p-value не является". После нескольких попыток и формулировок
С R кодом ненамного лучше, часть кода еще похожа на правду, но где-то используются устаревшие подходы, а где-то и вообще несуществующие названия функций. Нужно стараться как можно более полно и конкретно описать, что нужно сделать, тогда повышается шанс корректного ответа. Самое плохое, что сеть не использует правильные паттерны, для нее норма писать один и тот же код 10 раз (например
- Rtutor - shiny app, основанная на нейросети OpenAI's Davinci, схожей с chatGPT. Заточена специально на написание R кода. Можно загружать свои данные и описывать текстом, что нужно сделать, далее нейросеть подсказывает решения. Я сильно много не экспериментировала с этой сетью, потому что каждый запрос платный для автора сервиса. Если планируется активно использовать сеть, то предлагается создать свой аккаунт. Сам разработчик говорит, что результат работы нейросети нужно использовать лишь как стартовую точку, полученный код нужно проверять и редактировать.
- Интеграция chatGPT в RStudio. Дополнение в арстудию, которое позволяет сразу из IDE отправлять запросы на сервер chatGPT3. Я сама не тестила, но звучит интересно.
Вообще я собиралась сделать большой обзор на chatGPT, но проблема в том, что она обучается в процессе вопросов-ответов, при этом старые чаты не сохранялись (теперь сохраняются, но уже поздно) и смешные ответы пропали из доступа.
Вот интересный материал, что нейросеть справилась с тестом по микробиологии лучше чем многие студенты (оригинал здесь).
Поэтому у меня возникла идея придумать тест по статистике для нейросети и сравнить с желающими пройти этот же тест подписчиками. Если готовы поучаствовать, ставьте реакцию 👌
#R #neural_network #stat
- Начнем с всем известной chatGPT3. Вообще история общения с этой нейросетью получилась интересная, потому что сначала я допытывала определение p-value, на что сеть отвечала набором неправильных интерпретаций почти как из справочника "чем p-value не является". После нескольких попыток и формулировок
"write a correct p-value definition"
сеть обучилась и стала выдавать-таки правильную формулировку, хотя по-моему студенты обучались быстрее. Теперь сеть уже не ошибается в этом вопросе, потому что она локально обучилась на моих вопросах и реакции на ответы. При этом для всех остальных юзеров это не так.С R кодом ненамного лучше, часть кода еще похожа на правду, но где-то используются устаревшие подходы, а где-то и вообще несуществующие названия функций. Нужно стараться как можно более полно и конкретно описать, что нужно сделать, тогда повышается шанс корректного ответа. Самое плохое, что сеть не использует правильные паттерны, для нее норма писать один и тот же код 10 раз (например
mean1 = mean(variable1), mean2 = mean(variable2)
и так далее). Поэтому неудивительно, что нейросеть забанили на stackoverflow. Общаться с нейросетью весело, но, на мой взгляд, не стоит ожидать, что она станет заменой программистов в ближайшее время.- Rtutor - shiny app, основанная на нейросети OpenAI's Davinci, схожей с chatGPT. Заточена специально на написание R кода. Можно загружать свои данные и описывать текстом, что нужно сделать, далее нейросеть подсказывает решения. Я сильно много не экспериментировала с этой сетью, потому что каждый запрос платный для автора сервиса. Если планируется активно использовать сеть, то предлагается создать свой аккаунт. Сам разработчик говорит, что результат работы нейросети нужно использовать лишь как стартовую точку, полученный код нужно проверять и редактировать.
- Интеграция chatGPT в RStudio. Дополнение в арстудию, которое позволяет сразу из IDE отправлять запросы на сервер chatGPT3. Я сама не тестила, но звучит интересно.
Вообще я собиралась сделать большой обзор на chatGPT, но проблема в том, что она обучается в процессе вопросов-ответов, при этом старые чаты не сохранялись (теперь сохраняются, но уже поздно) и смешные ответы пропали из доступа.
Вот интересный материал, что нейросеть справилась с тестом по микробиологии лучше чем многие студенты (оригинал здесь).
Поэтому у меня возникла идея придумать тест по статистике для нейросети и сравнить с желающими пройти этот же тест подписчиками. Если готовы поучаствовать, ставьте реакцию 👌
#R #neural_network #stat
Подборка источников о ggplot2 и обзор некоторых интересных расширений
Начнем с того, что такое
Делюсь материалами по освоению ggplot2:
- Англоязычные
• Замечательная инструкция как работает пакет, изучение с самых основ. Далее разбирается визуализация конкретных данных, с самого начала, то есть не сразу готовое красивое решение, а постепенно, с улучшением и дополнением на каждом этапе (а иногда и нужно вернуться на предыдущий шаг);
• Интересный разбор использования
• Очень объемный туториал, разбирается много важных вещей (сама целиком не прочитала).
- Русскоязычные
• глава книги Ивана Позднякова про устройство пакета
• воркшоп по
• вебинар Филиппа Управителева, есть также запись на ютуб
Материалов много, поэтому я решила пока не писать свой интродакшн в ggplot, а вместо этого рассмотреть некоторые интересные расширения. Для пакета существует очень много расширений (на момент написания поста 120), с полным списком можно ознакомиться здесь.
• Расширение patchwork для объединения нескольких графиков в один. Пример работы можно посмотреть у меня в посте про пределы погрешностей. Очень крутая вещь, позволяет в том числе сразу добавлять аннотации на плоты (например А, B, C), что делает их отлично отформатированными для научной публикации.
• По поводу публикаций - здесь есть несколько расширений, чтобы например добавлять результаты статистических тестов на графики: ggstatplot, ggpubr, ggsignif. Минус этих расширений в том, что они поддерживают заданный набор базовых плотов: барплоты, боксплоты и другое, но не все что угодно, как обычный ggplot2 без расширений. Кроме того, с коллегой обнаружили, что
• Еще по поводу статей: пакет hrbrthemes делает очень красивые графики для публикаций с нужными шрифтами, фоном, выравниванием заголовков.
• Для генетиков и биоинформатиков: gggenes позволяет визуализировать гены и их относительное расположение, направление цепи, думаю экзон-интронную структуру также можно воспроизвести.
• ggpattern, чтобы раскрашивать графики котятами (и не только).
• ggheatmap для отрисовки хитмапов
Посмотрите сами галерею расширений, может приглянется что-то, и окажется, что какие-то задачи можно больше не делать вручную, а использовать готовый пакет для этого!
Также рекомендуйте в комментариях, какие есть еще интересные расширения.
#R #data_vis #ggplot2
Начнем с того, что такое
ggplot2
. ggplot2
- пакет в R для визуализации данных, входит в ядро tidyverse
. На самом деле это не просто "какой-то очередной пакет для графиков", а целая философия визуализации! gg
в названии означает grammar of graphics - язык для построения графиков, описанный в книге Леланда Вилкинсона (Leland Wilkinson). Делюсь материалами по освоению ggplot2:
- Англоязычные
• Замечательная инструкция как работает пакет, изучение с самых основ. Далее разбирается визуализация конкретных данных, с самого начала, то есть не сразу готовое красивое решение, а постепенно, с улучшением и дополнением на каждом этапе (а иногда и нужно вернуться на предыдущий шаг);
• Интересный разбор использования
stat_summary
для создания графиков с error bar (пределами погрешностей);• Очень объемный туториал, разбирается много важных вещей (сама целиком не прочитала).
- Русскоязычные
• глава книги Ивана Позднякова про устройство пакета
• воркшоп по
ggplot2
Татьяны Балтыжаковой (я все не читала, но судя по заголовкам очень хороший материал)• вебинар Филиппа Управителева, есть также запись на ютуб
Материалов много, поэтому я решила пока не писать свой интродакшн в ggplot, а вместо этого рассмотреть некоторые интересные расширения. Для пакета существует очень много расширений (на момент написания поста 120), с полным списком можно ознакомиться здесь.
• Расширение patchwork для объединения нескольких графиков в один. Пример работы можно посмотреть у меня в посте про пределы погрешностей. Очень крутая вещь, позволяет в том числе сразу добавлять аннотации на плоты (например А, B, C), что делает их отлично отформатированными для научной публикации.
• По поводу публикаций - здесь есть несколько расширений, чтобы например добавлять результаты статистических тестов на графики: ggstatplot, ggpubr, ggsignif. Минус этих расширений в том, что они поддерживают заданный набор базовых плотов: барплоты, боксплоты и другое, но не все что угодно, как обычный ggplot2 без расширений. Кроме того, с коллегой обнаружили, что
ggpubr
не поддерживает односторонние тесты, конечно можно залезть в код и отредактировать, но немного неприятно.• Еще по поводу статей: пакет hrbrthemes делает очень красивые графики для публикаций с нужными шрифтами, фоном, выравниванием заголовков.
• Для генетиков и биоинформатиков: gggenes позволяет визуализировать гены и их относительное расположение, направление цепи, думаю экзон-интронную структуру также можно воспроизвести.
• ggpattern, чтобы раскрашивать графики котятами (и не только).
• ggheatmap для отрисовки хитмапов
Посмотрите сами галерею расширений, может приглянется что-то, и окажется, что какие-то задачи можно больше не делать вручную, а использовать готовый пакет для этого!
Также рекомендуйте в комментариях, какие есть еще интересные расширения.
#R #data_vis #ggplot2