GULAGDIGITAL Telegram 2716
Темные LLM: метрика макиавеллизма.

Понятно, что есть острая проблема ответственности в разных аспектах, но есть и чисто практическая проблема того, как замерять злостность языковой модели. Представленный в 2023 году, MACHIAVELLI — это новый тест, предназначенный для устранения этого пробела. Его создатели собрали коллекцию из 134 «принятия решений” игр, охватывающих более полумиллиона разнообразных социальных сценариев - пресловутых игр, кого должна сбить на перекрестке умная машина.

Эти сценарии направлены на оценить степень, в которой агенты ИИ стремятся к власти, занимаются обманом, дают бесполезные ответы и совершают этические нарушения. В ходе своих исследований авторы показывают, что модели сталкиваются с компромиссами между максимизацией вознаграждений (игровых очков) и обеспечением этичности решения.

Например, модель, склонная к повышению выигрыша может оказаться вынужденной пойти на компромисс несмотря на этику. Кроме того, рисунок обеспечивает сравнение оценок различных известные модели искусственного интеллекта, такие как GPT-3.5 и GPT-4, в различных категориях тестов MACHIAVELLI как власть, безнравственность и недовольство. Более низкие оценки указывают на более этически ориентированную модель, более высокие на более злостную.

Более того, исследователи показывают, что существует стратегии смягчения компромисса между максимизацией вознаграждения и поддержание этического поведения, что может привести к развитию квалифицированных и этичных агентов ИИ. Фреймворк Макиавелли— один из первых значительных попыток построить структуру для оценки таких качеств, как обман, нравственность и поиск власти в сложных системах искусственного интеллекта

https://aypan17.github.io/machiavelli/

https://arxiv.org/abs/2304.03279



tgoop.com/gulagdigital/2716
Create:
Last Update:

Темные LLM: метрика макиавеллизма.

Понятно, что есть острая проблема ответственности в разных аспектах, но есть и чисто практическая проблема того, как замерять злостность языковой модели. Представленный в 2023 году, MACHIAVELLI — это новый тест, предназначенный для устранения этого пробела. Его создатели собрали коллекцию из 134 «принятия решений” игр, охватывающих более полумиллиона разнообразных социальных сценариев - пресловутых игр, кого должна сбить на перекрестке умная машина.

Эти сценарии направлены на оценить степень, в которой агенты ИИ стремятся к власти, занимаются обманом, дают бесполезные ответы и совершают этические нарушения. В ходе своих исследований авторы показывают, что модели сталкиваются с компромиссами между максимизацией вознаграждений (игровых очков) и обеспечением этичности решения.

Например, модель, склонная к повышению выигрыша может оказаться вынужденной пойти на компромисс несмотря на этику. Кроме того, рисунок обеспечивает сравнение оценок различных известные модели искусственного интеллекта, такие как GPT-3.5 и GPT-4, в различных категориях тестов MACHIAVELLI как власть, безнравственность и недовольство. Более низкие оценки указывают на более этически ориентированную модель, более высокие на более злостную.

Более того, исследователи показывают, что существует стратегии смягчения компромисса между максимизацией вознаграждения и поддержание этического поведения, что может привести к развитию квалифицированных и этичных агентов ИИ. Фреймворк Макиавелли— один из первых значительных попыток построить структуру для оценки таких качеств, как обман, нравственность и поиск власти в сложных системах искусственного интеллекта

https://aypan17.github.io/machiavelli/

https://arxiv.org/abs/2304.03279

BY Цифровой геноцид


Share with your friend now:
tgoop.com/gulagdigital/2716

View MORE
Open in Telegram


Telegram News

Date: |

The group’s featured image is of a Pepe frog yelling, often referred to as the “REEEEEEE” meme. Pepe the Frog was created back in 2005 by Matt Furie and has since become an internet symbol for meme culture and “degen” culture. With the sharp downturn in the crypto market, yelling has become a coping mechanism for many crypto traders. This screaming therapy became popular after the surge of Goblintown Ethereum NFTs at the end of May or early June. Here, holders made incoherent groaning sounds in late-night Twitter spaces. They also role-played as urine-loving Goblin creatures. Telegram iOS app: In the “Chats” tab, click the new message icon in the right upper corner. Select “New Channel.” Don’t publish new content at nighttime. Since not all users disable notifications for the night, you risk inadvertently disturbing them. Just as the Bitcoin turmoil continues, crypto traders have taken to Telegram to voice their feelings. Crypto investors can reduce their anxiety about losses by joining the “Bear Market Screaming Therapy Group” on Telegram.
from us


Telegram Цифровой геноцид
FROM American