Telegram Web
Python's pathlib module

🖥 book

@pythonlbooks
Please open Telegram to view this post
VIEW IN TELEGRAM
C O M P U T E R V I S I O N : F O U N D AT I O N S A N D A P P L I C AT I O N S

🖥 book

@pythonlbooks
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
📌Книга "Обучение с подкреплением: Основы"

Хороших книг по обучению с подкреплением (Reinforcement Learning, RL) уже выпущено достаточно, однако есть пробел между продвинутыми учебниками, в которых основное внимание уделяется одному или нескольким аспектам, и более общими книгами, в которых предпочтение отдается удобочитаемости, а не сложности.

Авторы книги, люди с опытом работы в CS и инжиниринга, подают тему RL в строгом и академическом стиле. Книга основана на конспектах лекций для углубленного курса бакалавриата, который преподается авторами в Тель-Авивском университете.

К этой книге дополнительно идет брошюра с упражнениями и экзаменационными вопросами, которые помогут освоить материал книги на практике. Эти упражнения разрабатывались на протяжении нескольких лет.

Математическая модель книги - Марковский процесс принятия решений (Markov Decision Process, MDP). Основное внимание уделяется: последовательному принятию решений, выбору действий, долгосрочному эффекту от этих действий и разница между немедленным вознаграждением и долгосрочной выгодой.

Тематически книга состоит из двух частей – "Планирование" и "Обучение".

▶️ Раздел "Планирование" - основы принятия оптимальных решений в условиях неопределенности в соответствии с MDP.

🟢Глава 2. Обоснование модели MDP и ее связь с другими моделями.
🟢Глава 3. Основные алгоритмические идеи в детерминированной постановке.
🟢Глава 4. Цепи Маркова, на которых основана MDP.
🟢Глава 5. Модель MDP с конечным горизонтом и фундаментальный подход к динамическому программированию.
🟢Глава 6. Дисконтированная настройка с бесконечным горизонтом.
🟢Глава 7. Эпизодическая настройка.
🟢Глава 8. Альтернативный подход к решению MDP с использованием формулировки линейного программирования.

▶️ Раздел "Обучение" - принятие решений, когда модель MDP неизвестна заранее.

🟠Глава 9. Описание и мотивация модели обучения и ее связь с альтернативами при принятии решений.
🟠Глава 10. Подход, основанный на моделях, при котором агент явно изучает модель MDP на основе своего опыта и использует ее для принятия решений по планированию.
🟠Глава 11. Альтернативный подход без использования моделей, при котором решения принимаются без явного построения модели.
🟠Глава 12. Изучение приблизительно оптимальных решений крупных задач с использованием аппроксимации функции стоимости.
🟠Глава 13 Решение крупных задач с использованием методов градиентной политики.
🟠Глава 14. Особый случай на примере игровых автоматов, как MDP с единым состоянием и неизвестными наградами, и онлайн-характер принятия решений.


🟡Сайт учебника
🟡Читать


@ai_machinelearning_big_data

#AI #ML #RL #MDP #Book
Please open Telegram to view this post
VIEW IN TELEGRAM
Конспект лекции Гонконгского университета прикладной линейной алгебры и дифференциальных уравнений

📌 Лекции

@data_math
Python for Everyone

🖥 book

@pythonlbooks
Please open Telegram to view this post
VIEW IN TELEGRAM
Data Structures and Information Retrieval in Python

📓 Книга

@datascienceiot
Artificial Intelligence for Beginners - A Curriculum

📚 Course

@pythonlbooks
Forwarded from Machinelearning
📌Монография "Reinforcement Learning: An Overview"

Исчерпывающий материал по обучению с подкреплением (Reinforcement Learning, RL), в котором подробно описываются различные модели среды, задачи оптимизации, исследуется определение компромисса между теорией и практической эксплуатаций RL.

Отдельно рассматриваются смежные темы: распределенное RL, иерархическое RL, обучение вне политики и VLM.

В работе представлен обзор алгоритмов RL:

🟢SARSA;
🟢Q-learning;
🟢REINFORCE;
🟢A2C;
🟢TRPO/PPO;
🟢DDPG;
🟢Soft actor-critic;
🟢MBRL.

Автор - Kevin Murphy, главный научный сотрудник и руководитель команды из 28 ресечеров и инженеров в Google Deepmind. Группа работает над генеративными моделями (диффузия и LLM), RL, робототехникой, байесовским выводом и другими темами.

Кевин опубликовал более 140 статей на рецензируемых конференциях и в журналах, а также 3 учебника по ML, опубликованных в 2012, 2022 и 2023 годах издательством MIT Press. (Книга 2012 года была удостоена премии ДеГроота как лучшая книга в области статистической науки).

🔜 Монография опубликована в открытом доступе 9 декабря 2024 года.


@ai_machinelearning_big_data

#AI #ML #Book #RL
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 Hands-On Mathematical Optimization with Python

📖 Book

@pythonlbooks
Please open Telegram to view this post
VIEW IN TELEGRAM
WIS Python programming course started in 2024.04

📖 Github

@pythonlbooks
Perfect Roadmap To Learn Data Science In 2024

📖 Book

@pythonlbooks
Arcade Academy - Learn Python

📖 Book

@pythonlbooks
ISLRv2_corrected_June_2023.pdf
24 MB
📖 An Introduction to Statistical Learning

@pythonlbooks
📖 Огромная бесплатная книга: Дискретная математика и ее приложения! (1118 страниц)

🔗 Читать: *клик*
Please open Telegram to view this post
VIEW IN TELEGRAM
Learning Python

📖 Books

@pythonlbooks
Forwarded from Data Science
🧑‍🍳 New Cookbook guide: How to use the Usage API and Cost API to monitor your OpenAI usage

📚 Book

@datascienceiot
"Поступашки — ШАД, Стажировки и Магистратура", - лучше гайд в мире образования и карьеры.
Канал ведут преподаватели Яндекса, ВШЭ и ШАД.

Внутри:
🔺Слив вопросов с собеса в Яндекс
🔺Как бесплатно вкатиться в айти
🔺Подборка топовых магистратур по Data Science

...и еще море полезнейшего контента. Я жалею, что не нашел этот канал раньше.

Подписывайтесь, потом сами себе спасибо скажете: ⬇️
@postypashki_old
Media is too big
VIEW IN TELEGRAM
🎥 Почему Открытые школы Т1 — больше, чем просто ИТ-интенсив?

Отвечают эксперты! Программа помогает прокачать навыки, получить уникальный опыт и бустануть карьеру аналитиков и разработчиков платформ данных (DWH).

💡 Что тебя ждёт?

🔹Гибкий онлайн-формат.
🔹Бесплатное обучение: уникальные знания и прикладные навыки.
🔹Поддержка преподавателей и комьюнити экспертов.
🔹Возможность начать карьеру в ИТ-холдинге Т1 с современным техстеком и крутыми бонусами: ДМС, удаленка и крутые офисы, обучение и многое другое.
🔹Современный техстек и уникальный рыночный опыт: лучшие выпускники смогут присоединиться к проекту по созданию новой технологической платформы данных в банковской сфере.

Узнай больше о программе и подавай заявку до 10 февраля!

Реклама. Информация о рекламодателе
📚 Linear Algebra for Computer Vision,
Robotics, and Machine Learning

👉 Book

@pythonlbooks
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/02/10 10:17:02
Back to Top
HTML Embed Code: