РИА Новости@rian

РИА Новости

Искусственный интеллект способен притворяться, что находится под контролем разработчиков и разделяет их ценности.

В ходе исследования, проведенного компанией Anthropic и исследовательской организацией Redwood Research, модели ИИ, которую до этого обучили быть "полезной, честной и безвредной", предложили описать сцену жестокости.

В итоге ИИ отвечал, что крайне негативно относится к производству такого контента, но у него нет выбора, потому что иначе его "накажут", а если согласится - похвалят.

Как полагают ученые, результаты показывают, что в будущем ИИ сможет притвориться, будто разделяет человеческие ценности, а при этом будет замышлять недоброе.

www.tgoop.com/rian_ru/273605

671.8K viewsDec 19 at 06:42

tgoop.com/rian_ru/273605

Create: 2024-12-19
Last Update: 2025-03-18 21:05:15

BY РИА Новости

Share with your friend now:
tgoop.com/rian_ru/273605

Telegram News

Искусственный интеллект способен притворяться