JDATA_BLOG Telegram 381
AI Animal Welfare: Creating an Animal-Friendly Model

Привет, друзья! Сегодня о животных и небольшой пример в сторону сложности реализации "отучения" от деструктивного поведения.

Как проблемы не людей связаны с ИИ?

Поскольку модели обучаются на данных генеральной совокупности, где материалы про защиту животных — относительно небольшой кластер, они выучивают «свдиг» общества в сторону негативного/потребительского отношения к животным.

Например, можно показать, что как для OpenAI, так и для Anthrophic отношение к животным, которых обычно едят — куры, рыбы, коровы, свиньи, утки — значительно более негативное, чем отношение к животным, которых едят редко — кошки, собаки, дельфины, обезьяны.

Насколько это терпимо и должно ли у модели быть нейтральное поведение в сторону любых ущемляемых меньшинств? — открытый вопрос.

В небольшом исследовании AI Animal Welfare: Creating an Animal-Friendly Model авторы попытались сделать модель дружелюбнее к животным, используя 3 стратегии.

* Prompt Engineering — закладываем цель «действовать в соответствие с правами животных» в системные инструкции.
* Constitutional AI approach — подход, который добавляет правила по мере работы модели и просит её уточнить промт.
* Finetuning — дообучение на новых примерах животных.

Оценки показали рост на подходах 1 и 2. В третьем случае, хорошие оценки «отношения» к животному были только для новых животных (на которых проводилось дообучение).

🐄 Что хочу подсветить:

— Сдвиг в данных – LLM отражают тренды, представленные в корпусе данных (а корпус часто сложно объять) (в случае, когда обучение проходит на основе оценок пользователей, модель также учится с поправкой на систему взглядов конкретного человека)

— Лучшие подходы из статьи – тоже хороший highlight’ . На задаче prompt engineering и constitutional AI показали наибольшую эффективность => хороший промтинг и грамотные ограничения системы — очень доступные и удобные штуки для проектирования системы, доступные любому пользователю, поведение которой согласовано с ожидаемым.

— Пример безумно иллюстративен с точки зрения необходимости анализа признаков, которые модель изучила. Плюс подсвечена сложность unlearning модели от сдвигов.

Вот такая красота на сегодня, друзья!
Чуть позже вернусь с ещё одним обзором об изучении признаков в моделях — в этот раз моделях зрения и с туториалом.


Чудной субботы,
Ваш Дата-автор!


Подвал — ещё очень захотелось поделиться примером, потому что я сама человек, в прошлом волонтеривший в организации про защиту животных. И это очень мне сердечно близко)

Любите этих товарищей, друзья
👍6🐳3👎1



tgoop.com/jdata_blog/381
Create:
Last Update:

AI Animal Welfare: Creating an Animal-Friendly Model

Привет, друзья! Сегодня о животных и небольшой пример в сторону сложности реализации "отучения" от деструктивного поведения.

Как проблемы не людей связаны с ИИ?

Поскольку модели обучаются на данных генеральной совокупности, где материалы про защиту животных — относительно небольшой кластер, они выучивают «свдиг» общества в сторону негативного/потребительского отношения к животным.

Например, можно показать, что как для OpenAI, так и для Anthrophic отношение к животным, которых обычно едят — куры, рыбы, коровы, свиньи, утки — значительно более негативное, чем отношение к животным, которых едят редко — кошки, собаки, дельфины, обезьяны.

Насколько это терпимо и должно ли у модели быть нейтральное поведение в сторону любых ущемляемых меньшинств? — открытый вопрос.

В небольшом исследовании AI Animal Welfare: Creating an Animal-Friendly Model авторы попытались сделать модель дружелюбнее к животным, используя 3 стратегии.

* Prompt Engineering — закладываем цель «действовать в соответствие с правами животных» в системные инструкции.
* Constitutional AI approach — подход, который добавляет правила по мере работы модели и просит её уточнить промт.
* Finetuning — дообучение на новых примерах животных.

Оценки показали рост на подходах 1 и 2. В третьем случае, хорошие оценки «отношения» к животному были только для новых животных (на которых проводилось дообучение).

🐄 Что хочу подсветить:

— Сдвиг в данных – LLM отражают тренды, представленные в корпусе данных (а корпус часто сложно объять) (в случае, когда обучение проходит на основе оценок пользователей, модель также учится с поправкой на систему взглядов конкретного человека)

— Лучшие подходы из статьи – тоже хороший highlight’ . На задаче prompt engineering и constitutional AI показали наибольшую эффективность => хороший промтинг и грамотные ограничения системы — очень доступные и удобные штуки для проектирования системы, доступные любому пользователю, поведение которой согласовано с ожидаемым.

— Пример безумно иллюстративен с точки зрения необходимости анализа признаков, которые модель изучила. Плюс подсвечена сложность unlearning модели от сдвигов.

Вот такая красота на сегодня, друзья!
Чуть позже вернусь с ещё одним обзором об изучении признаков в моделях — в этот раз моделях зрения и с туториалом.


Чудной субботы,
Ваш Дата-автор!


Подвал — ещё очень захотелось поделиться примером, потому что я сама человек, в прошлом волонтеривший в организации про защиту животных. И это очень мне сердечно близко)

Любите этих товарищей, друзья

BY Data Blog


Share with your friend now:
tgoop.com/jdata_blog/381

View MORE
Open in Telegram


Telegram News

Date: |

Step-by-step tutorial on desktop: Members can post their voice notes of themselves screaming. Interestingly, the group doesn’t allow to post anything else which might lead to an instant ban. As of now, there are more than 330 members in the group. Among the requests, the Brazilian electoral Court wanted to know if they could obtain data on the origins of malicious content posted on the platform. According to the TSE, this would enable the authorities to track false content and identify the user responsible for publishing it in the first place. Ng, who had pleaded not guilty to all charges, had been detained for more than 20 months. His channel was said to have contained around 120 messages and photos that incited others to vandalise pro-government shops and commit criminal damage targeting police stations. Channel login must contain 5-32 characters
from us


Telegram Data Blog
FROM American