tgoop.com/tech_priestess/974
Last Update:
Интересный рассказ с картинками про то, как приноровились менять поведение предтренированной модели, воздействуя непосредственно на её эмбеддинги:
https://www.tgoop.com/seeallochnaya/682
https://www.tgoop.com/seeallochnaya/685
https://www.tgoop.com/seeallochnaya/687
(Три последовательных поста)
Акцент делается на задачах alignment и детекции галлюцинаций. Но я думаю, что если подтвердится информация о том, что эти задачи хорошо решаются, то можно будет приспособить метод и для многого другого.
Основой поста служит статья Representation Engineering: A Top-Down Approach to AI Transparency ( https://arxiv.org/abs/2310.01405 ), надо будет ее разобрать, чтобы понять детали того, как именно "сдвигают" представления в пространстве эмбеддингов для получения нужного эффекта, потому что мне понравилась идея. ✍
#объяснения_статей
BY Техножрица 👩💻👩🏫👩🔧
Share with your friend now:
tgoop.com/tech_priestess/974