tgoop.com/seeallochnaya/376
Last Update:
Сегодня был третий день DataFest 2023 и первый — для секции Instruct Models, в организации которой я принимал активное участие. Нашел лекторов, помог с выбором тем, кому-то с драфтами презентаций. В общем, получил очень клевый опыт.
Саму же секцию открывал мой доклад под названием "RLHF Intro: from Zero to Aligned Intelligent Systems". В нём я рассказываю про то, как так вышло, что пересеклись две области машинного обучения — Natural Language Processing и Reinforcement Learning, и почему (и как!) в результате этого родилась ChatGPT. Доклад в большей степени технический, для настроенной аудитории, однако уверен, что даже люди, не работающие в сфере ML, смогут понять 75% (а если сильно захотят — то и все 85%!).
Презентация оканчивается обзором проблемы AI Alignment, и автоматической валидацией Intelligent систем: в том числе упоминается статья "Constitutional AI: Harmlessness from AI Feedback", где инженеры Anthropic обучали модель на фидбеке...от другой модели 😐 так, скоро и кожаные не нужны будут...
Смотреть: https://youtu.be/4W3MQkApH9Y
Слайды презентации: тут
P.S.: лекция — с новым качественным микрофоном!!!