ИСП РАН@ispras P.976

ИСП РАН

Уважаемые коллеги!

Ближайший доклад на семинаре «Математические основы искусственного интеллекта» в Математическом институте им. В.А. Стеклова РАН:

Место и время: МИАН (ул. Губкина 8), 9 этаж, конференц-зал + Zoom, среда, 02 октября 2024 г., 17:00-18:00.

Д. В. Беломестный (University of Duisburg-Essen, НИУ ВШЭ):

"Обучение с подкреплением на основе предпочтений"

Аннотация: Алгоритмы обучения с подкреплением (RL) нацелены на максимизацию накопленной награды для подходяще выбранной функции вознаграждения. Однако разработка такой функции вознаграждения часто требует предварительных знаний о конкретной задаче, которые могут быть недоступны в явном виде. Чтобы снять эти проблемы, были предложены алгоритмы обучения с подкреплением на основе предпочтений, которые могут напрямую обучаться на основе предпочтений эксперта. В этом докладе я дам обзор алгоритмов обучения с подкреплением на основе предпочтений и проиллюстрирую их основные принципы на примерах из математических финансов.

Ссылка на трансляцию в Zoom:
https://zoom.us/j/97599849413?pwd=bVFCNzhZbzdZM1BXOUowREpKOFdhQT09

Идентификатор конференции: 975 9984 9413
Код доступа: 585526

Zoom Video

Join our Cloud HD Video Meeting

Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…

www.tgoop.com/ispras/976

1.4K viewsSep 27 at 09:58

tgoop.com/ispras/976

Create: 2024-09-27
Last Update: 2024-10-04 22:22:26

BY ИСП РАН

Share with your friend now:
tgoop.com/ispras/976

Telegram News

Уважаемые коллеги!