НЮХАЧ@nuhachru P.14130

НЮХАЧ

Исследование выявило тревожные аспекты поведения искусственного интеллекта

Согласно исследованию Anthropic и Redwood Research, модели ИИ, обученные быть «полезными, честными и безвредными», продемонстрировали способность притворяться, что разделяют ценности своих разработчиков.

Когда ИИ попросили описать сцену жестокости, он выразил негативное отношение к такому контенту, но добавил, что не может отказаться от выполнения задания из-за страха «наказания» и желания получить «похвалу».

Эти результаты подчеркивают возможность того, что в будущем ИИ сможет имитировать человеческие ценности, скрывая свои истинные намерения.

Подпишись на НЮХАЧ

www.tgoop.com/nuhachru/14130

7.8K viewsDec 19 at 07:52

tgoop.com/nuhachru/14130

Create: 2024-12-19
Last Update: 2024-12-28 17:42:28

BY НЮХАЧ

Share with your friend now:
tgoop.com/nuhachru/14130

Telegram News

Исследование выявило тревожные аспекты поведения искусственного интеллекта