Deep Dive 2 Deep Learning@ddtodl P.476

Deep Dive 2 Deep Learning

📚Монография "Reinforcement Learning: An Overview" — фундаментальный труд по RL

Автор монографии, Кевин Мерфи, главный научный сотрудник Google DeepMind, представил исчерпывающий обзор обучения с подкреплением (Reinforcement Learning, RL).

🔎В книге исследуются:

✅Модели среды и задачи оптимизации.
✅Компромисс между теорией и практикой RL.
✅Смежные темы: распределённое RL, иерархическое RL, обучение вне политики, визуально-ориентированное RL (VLM).

🔥Обзор алгоритмов:

✅ SARSA
✅ Q-learning
✅ REINFORCE
✅ A2C
✅ TRPO/PPO
✅ DDPG
✅ Soft Actor-Critic
✅ MBRL (Model-Based RL)

Кевин Мерфи и его команда из 28 инженеров и исследователей Google DeepMind работают над передовыми направлениями: RL, генеративные модели, робототехника и байесовский вывод.

Ранее Кевин опубликовал более 140 статей и три учебника по машинному обучению. Его книга 2012 года получила премию ДеГроота за вклад в статистическую науку.

➡️Монография опубликована в открытом доступе 9 декабря 2024

www.tgoop.com/ddtodl/476

130 viewsDec 12 at 15:59

tgoop.com/ddtodl/476

Create: 2024-12-12
Last Update: 2025-01-16 10:49:18

BY Deep Dive 2 Deep Learning

Share with your friend now:
tgoop.com/ddtodl/476

Telegram News

📚Монография "Reinforcement Learning: An Overview" — фундаментальный труд по RL