Техножрица 👩‍💻👩‍🏫👩‍🔧@tech

Техножрица 👩‍💻👩‍🏫👩‍🔧

Интересный рассказ с картинками про то, как приноровились менять поведение предтренированной модели, воздействуя непосредственно на её эмбеддинги:

https://www.tgoop.com/seeallochnaya/682
https://www.tgoop.com/seeallochnaya/685
https://www.tgoop.com/seeallochnaya/687
(Три последовательных поста)

Акцент делается на задачах alignment и детекции галлюцинаций. Но я думаю, что если подтвердится информация о том, что эти задачи хорошо решаются, то можно будет приспособить метод и для многого другого.

Основой поста служит статья Representation Engineering: A Top-Down Approach to AI Transparency ( https://arxiv.org/abs/2310.01405 ), надо будет ее разобрать, чтобы понять детали того, как именно "сдвигают" представления в пространстве эмбеддингов для получения нужного эффекта, потому что мне понравилась идея. ✍

#объяснения_статей

Сиолошная

Representation Engineering: A Top-Down Approach to AI Transparency

Собрались как-то более 20 исследователей со всех уголков LLM-мира, от Berkeley до Center for AI Safety, и решили написать статью с описанием новой области: инженерии представлений (representation…

www.tgoop.com/tech_priestess/974

3.0K viewsOct 4, 2023 at 07:05

tgoop.com/tech_priestess/974

Create: 2023-10-04
Last Update: 2025-01-15 10:54:28

BY Техножрица 👩‍💻👩‍🏫👩‍🔧

Share with your friend now:
tgoop.com/tech_priestess/974

Telegram News

Интересный рассказ с картинками про то