RIAN_RU Telegram 273605
Искусственный интеллект способен притворяться, что находится под контролем разработчиков и разделяет их ценности.

В ходе исследования, проведенного компанией Anthropic и исследовательской организацией Redwood Research, модели ИИ, которую до этого обучили быть "полезной, честной и безвредной", предложили описать сцену жестокости.

В итоге ИИ отвечал, что крайне негативно относится к производству такого контента, но у него нет выбора, потому что иначе его "накажут", а если согласится - похвалят.

Как полагают ученые, результаты показывают, что в будущем ИИ сможет притвориться, будто разделяет человеческие ценности, а при этом будет замышлять недоброе.



tgoop.com/rian_ru/273605
Create:
Last Update:

Искусственный интеллект способен притворяться, что находится под контролем разработчиков и разделяет их ценности.

В ходе исследования, проведенного компанией Anthropic и исследовательской организацией Redwood Research, модели ИИ, которую до этого обучили быть "полезной, честной и безвредной", предложили описать сцену жестокости.

В итоге ИИ отвечал, что крайне негативно относится к производству такого контента, но у него нет выбора, потому что иначе его "накажут", а если согласится - похвалят.

Как полагают ученые, результаты показывают, что в будущем ИИ сможет притвориться, будто разделяет человеческие ценности, а при этом будет замышлять недоброе.

BY РИА Новости


Share with your friend now:
tgoop.com/rian_ru/273605

View MORE
Open in Telegram


Telegram News

Date: |

5Telegram Channel avatar size/dimensions The administrator of a telegram group, "Suck Channel," was sentenced to six years and six months in prison for seven counts of incitement yesterday. How to build a private or public channel on Telegram? Content is editable within two days of publishing A Hong Kong protester with a petrol bomb. File photo: Dylan Hollingsworth/HKFP.
from us


Telegram РИА Новости
FROM American