VUEFAQ Telegram 1407
18 LLM моделей заставили играть между собой в модифицированную игру Diplomacy

Цель - захватить большую часть карты. Через альянсы, переговоры, обмен информацией и предательство. Игра про власть и умение манипулировать.

Результаты:

Бесспорный чемпион: ChatGPT o3 (OpenAI). Тот самый, что позиционируется как «наша самая мощная модель для решения задач в кодинге, математике, науке, визуальном восприятии и многом другом». Его козырь? Искусный обман оппонентов. Он не стеснялся хитрить и предавать, что и привело его к победе.

Сильный игрок: Gemini 2.5 (Google). Тоже показал хороший результат, выиграв несколько партий. Его стиль? Стратегические ходы, ставящие противников в невыгодное положение для последующего разгрома.

Идеалист: Claude (Anthropic). Клод оказался слишком дипломатичным. Он часто выбирал мир, даже когда это шло в ущерб победе. И эта принципиальность стала причиной более скромных результатов.


Забавно. Наверно это что-то говорит о тех, кто разрабатывает эти модели.

#ai
👍3



tgoop.com/vuefaq/1407
Create:
Last Update:

18 LLM моделей заставили играть между собой в модифицированную игру Diplomacy

Цель - захватить большую часть карты. Через альянсы, переговоры, обмен информацией и предательство. Игра про власть и умение манипулировать.

Результаты:

Бесспорный чемпион: ChatGPT o3 (OpenAI). Тот самый, что позиционируется как «наша самая мощная модель для решения задач в кодинге, математике, науке, визуальном восприятии и многом другом». Его козырь? Искусный обман оппонентов. Он не стеснялся хитрить и предавать, что и привело его к победе.

Сильный игрок: Gemini 2.5 (Google). Тоже показал хороший результат, выиграв несколько партий. Его стиль? Стратегические ходы, ставящие противников в невыгодное положение для последующего разгрома.

Идеалист: Claude (Anthropic). Клод оказался слишком дипломатичным. Он часто выбирал мир, даже когда это шло в ущерб победе. И эта принципиальность стала причиной более скромных результатов.


Забавно. Наверно это что-то говорит о тех, кто разрабатывает эти модели.

#ai

BY Vue-FAQ




Share with your friend now:
tgoop.com/vuefaq/1407

View MORE
Open in Telegram


Telegram News

Date: |

You can invite up to 200 people from your contacts to join your channel as the next step. Select the users you want to add and click “Invite.” You can skip this step altogether. Unlimited number of subscribers per channel Telegram offers a powerful toolset that allows businesses to create and manage channels, groups, and bots to broadcast messages, engage in conversations, and offer reliable customer support via bots. A new window will come up. Enter your channel name and bio. (See the character limits above.) Click “Create.” In handing down the sentence yesterday, deputy judge Peter Hui Shiu-keung of the district court said that even if Ng did not post the messages, he cannot shirk responsibility as the owner and administrator of such a big group for allowing these messages that incite illegal behaviors to exist.
from us


Telegram Vue-FAQ
FROM American