Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
Хороших книг по обучению с подкреплением (Reinforcement Learning, RL) уже выпущено достаточно, однако есть пробел между продвинутыми учебниками, в которых основное внимание уделяется одному или нескольким аспектам, и более общими книгами, в которых предпочтение отдается удобочитаемости, а не сложности.
Авторы книги, люди с опытом работы в CS и инжиниринга, подают тему RL в строгом и академическом стиле. Книга основана на конспектах лекций для углубленного курса бакалавриата, который преподается авторами в Тель-Авивском университете.
К этой книге дополнительно идет брошюра с упражнениями и экзаменационными вопросами, которые помогут освоить материал книги на практике. Эти упражнения разрабатывались на протяжении нескольких лет.
Математическая модель книги - Марковский процесс принятия решений (Markov Decision Process, MDP). Основное внимание уделяется: последовательному принятию решений, выбору действий, долгосрочному эффекту от этих действий и разница между немедленным вознаграждением и долгосрочной выгодой.
Тематически книга состоит из двух частей – "Планирование" и "Обучение".
@ai_machinelearning_big_data
#AI #ML #RL #MDP #Book
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Математика Дата саентиста
Конспект лекции Гонконгского университета прикладной линейной алгебры и дифференциальных уравнений
📌 Лекции
@data_math
📌 Лекции
@data_math
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
Исчерпывающий материал по обучению с подкреплением (Reinforcement Learning, RL), в котором подробно описываются различные модели среды, задачи оптимизации, исследуется определение компромисса между теорией и практической эксплуатаций RL.
Отдельно рассматриваются смежные темы: распределенное RL, иерархическое RL, обучение вне политики и VLM.
В работе представлен обзор алгоритмов RL:
Автор - Kevin Murphy, главный научный сотрудник и руководитель команды из 28 ресечеров и инженеров в Google Deepmind. Группа работает над генеративными моделями (диффузия и LLM), RL, робототехникой, байесовским выводом и другими темами.
Кевин опубликовал более 140 статей на рецензируемых конференциях и в журналах, а также 3 учебника по ML, опубликованных в 2012, 2022 и 2023 годах издательством MIT Press. (Книга 2012 года была удостоена премии ДеГроота как лучшая книга в области статистической науки).
@ai_machinelearning_big_data
#AI #ML #Book #RL
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Data Science
🧑🍳 New Cookbook guide: How to use the Usage API and Cost API to monitor your OpenAI usage
📚 Book
@datascienceiot
📚 Book
@datascienceiot
"Поступашки — ШАД, Стажировки и Магистратура", - лучше гайд в мире образования и карьеры.
Канал ведут преподаватели Яндекса, ВШЭ и ШАД.
Внутри:
🔺Слив вопросов с собеса в Яндекс
🔺Как бесплатно вкатиться в айти
🔺Подборка топовых магистратур по Data Science
...и еще море полезнейшего контента. Я жалею, что не нашел этот канал раньше.
Подписывайтесь, потом сами себе спасибо скажете: ⬇️
@postypashki_old
Канал ведут преподаватели Яндекса, ВШЭ и ШАД.
Внутри:
🔺Слив вопросов с собеса в Яндекс
🔺Как бесплатно вкатиться в айти
🔺Подборка топовых магистратур по Data Science
...и еще море полезнейшего контента. Я жалею, что не нашел этот канал раньше.
Подписывайтесь, потом сами себе спасибо скажете: ⬇️
@postypashki_old
Telegram
Поступашки - ШАД, Стажировки и Магистратура
По всем вопросам: @vice22821
Чат: @postypashki_old_chat
Боталка: @botalkaaa
Карьера: @postupashki_career
Ютуб: https://youtube.com/@postupashki_old
Поступач: @postypashki_mems
Алгосы: @algoses
Чат: @postypashki_old_chat
Боталка: @botalkaaa
Карьера: @postupashki_career
Ютуб: https://youtube.com/@postupashki_old
Поступач: @postypashki_mems
Алгосы: @algoses
Media is too big
VIEW IN TELEGRAM
🎥 Почему Открытые школы Т1 — больше, чем просто ИТ-интенсив?
Отвечают эксперты! Программа помогает прокачать навыки, получить уникальный опыт и бустануть карьеру аналитиков и разработчиков платформ данных (DWH).
💡 Что тебя ждёт?
🔹Гибкий онлайн-формат.
🔹Бесплатное обучение: уникальные знания и прикладные навыки.
🔹Поддержка преподавателей и комьюнити экспертов.
🔹Возможность начать карьеру в ИТ-холдинге Т1 с современным техстеком и крутыми бонусами: ДМС, удаленка и крутые офисы, обучение и многое другое.
🔹Современный техстек и уникальный рыночный опыт: лучшие выпускники смогут присоединиться к проекту по созданию новой технологической платформы данных в банковской сфере.
✨ Узнай больше о программе и подавай заявку до 10 февраля!
Реклама. Информация о рекламодателе
Отвечают эксперты! Программа помогает прокачать навыки, получить уникальный опыт и бустануть карьеру аналитиков и разработчиков платформ данных (DWH).
💡 Что тебя ждёт?
🔹Гибкий онлайн-формат.
🔹Бесплатное обучение: уникальные знания и прикладные навыки.
🔹Поддержка преподавателей и комьюнити экспертов.
🔹Возможность начать карьеру в ИТ-холдинге Т1 с современным техстеком и крутыми бонусами: ДМС, удаленка и крутые офисы, обучение и многое другое.
🔹Современный техстек и уникальный рыночный опыт: лучшие выпускники смогут присоединиться к проекту по созданию новой технологической платформы данных в банковской сфере.
✨ Узнай больше о программе и подавай заявку до 10 февраля!
Реклама. Информация о рекламодателе
Please open Telegram to view this post
VIEW IN TELEGRAM