ISPRAS Telegram 976
Уважаемые коллеги!

Ближайший доклад на семинаре «Математические основы искусственного интеллекта» в Математическом институте им. В.А. Стеклова РАН:

Место и время: МИАН (ул. Губкина 8), 9 этаж, конференц-зал + Zoom, среда, 02 октября 2024 г., 17:00-18:00.

Д. В. Беломестный (University of Duisburg-Essen, НИУ ВШЭ):

"Обучение с подкреплением на основе предпочтений"

Аннотация: Алгоритмы обучения с подкреплением (RL) нацелены на максимизацию накопленной награды для подходяще выбранной функции вознаграждения. Однако разработка такой функции вознаграждения часто требует предварительных знаний о конкретной задаче, которые могут быть недоступны в явном виде. Чтобы снять эти проблемы, были предложены алгоритмы обучения с подкреплением на основе предпочтений, которые могут напрямую обучаться на основе предпочтений эксперта. В этом докладе я дам обзор алгоритмов обучения с подкреплением на основе предпочтений и проиллюстрирую их основные принципы на примерах из математических финансов.

Ссылка на трансляцию в Zoom:
https://zoom.us/j/97599849413?pwd=bVFCNzhZbzdZM1BXOUowREpKOFdhQT09

Идентификатор конференции: 975 9984 9413
Код доступа: 585526



tgoop.com/ispras/976
Create:
Last Update:

Уважаемые коллеги!

Ближайший доклад на семинаре «Математические основы искусственного интеллекта» в Математическом институте им. В.А. Стеклова РАН:

Место и время: МИАН (ул. Губкина 8), 9 этаж, конференц-зал + Zoom, среда, 02 октября 2024 г., 17:00-18:00.

Д. В. Беломестный (University of Duisburg-Essen, НИУ ВШЭ):

"Обучение с подкреплением на основе предпочтений"

Аннотация: Алгоритмы обучения с подкреплением (RL) нацелены на максимизацию накопленной награды для подходяще выбранной функции вознаграждения. Однако разработка такой функции вознаграждения часто требует предварительных знаний о конкретной задаче, которые могут быть недоступны в явном виде. Чтобы снять эти проблемы, были предложены алгоритмы обучения с подкреплением на основе предпочтений, которые могут напрямую обучаться на основе предпочтений эксперта. В этом докладе я дам обзор алгоритмов обучения с подкреплением на основе предпочтений и проиллюстрирую их основные принципы на примерах из математических финансов.

Ссылка на трансляцию в Zoom:
https://zoom.us/j/97599849413?pwd=bVFCNzhZbzdZM1BXOUowREpKOFdhQT09

Идентификатор конференции: 975 9984 9413
Код доступа: 585526

BY ИСП РАН


Share with your friend now:
tgoop.com/ispras/976

View MORE
Open in Telegram


Telegram News

Date: |

Hui said the messages, which included urging the disruption of airport operations, were attempts to incite followers to make use of poisonous, corrosive or flammable substances to vandalize police vehicles, and also called on others to make weapons to harm police. Today, we will address Telegram channels and how to use them for maximum benefit. Content is editable within two days of publishing Members can post their voice notes of themselves screaming. Interestingly, the group doesn’t allow to post anything else which might lead to an instant ban. As of now, there are more than 330 members in the group.
from us


Telegram ИСП РАН
FROM American