tgoop.com/ispras/976
Last Update:
Уважаемые коллеги!
Ближайший доклад на семинаре «Математические основы искусственного интеллекта» в Математическом институте им. В.А. Стеклова РАН:
Место и время: МИАН (ул. Губкина 8), 9 этаж, конференц-зал + Zoom, среда, 02 октября 2024 г., 17:00-18:00.
Д. В. Беломестный (University of Duisburg-Essen, НИУ ВШЭ):
"Обучение с подкреплением на основе предпочтений"
Аннотация: Алгоритмы обучения с подкреплением (RL) нацелены на максимизацию накопленной награды для подходяще выбранной функции вознаграждения. Однако разработка такой функции вознаграждения часто требует предварительных знаний о конкретной задаче, которые могут быть недоступны в явном виде. Чтобы снять эти проблемы, были предложены алгоритмы обучения с подкреплением на основе предпочтений, которые могут напрямую обучаться на основе предпочтений эксперта. В этом докладе я дам обзор алгоритмов обучения с подкреплением на основе предпочтений и проиллюстрирую их основные принципы на примерах из математических финансов.
Ссылка на трансляцию в Zoom:
https://zoom.us/j/97599849413?pwd=bVFCNzhZbzdZM1BXOUowREpKOFdhQT09
Идентификатор конференции: 975 9984 9413
Код доступа: 585526
BY ИСП РАН
Share with your friend now:
tgoop.com/ispras/976