Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
8032 - Telegram Web
Telegram Web
BountyBench A framework to capture offensive & defensive cyber-capabilities in evolving real-world systems. https://bountybench.github.io/
Forwarded from Paradigm
A once-exotic concept in quantum information, entanglement embezzlement, has taken a leap forward. Researchers have shown that universal embezzlement, where highly entangled states enable impossible transitions without being consumed, naturally arises in critical fermion chains, systems at quantum phase transitions.

https://www.nature.com/articles/s41567-025-02921-w
Forwarded from Neural Shit
Там Claude опубликовали у себя на сайте отчёт об их эксперименте, в котором их ИИ управлял офисным мини-магазином и немного ёбнулся.

Проект называется Project Vend. Модель Claude Sonnet 3.7 в течение месяца играла в бизнесмена: закупала снеки у "оптовиков", ставила цены, общалась с "клиентами", вела финансы. Всё как у людей (кроме рук). Зато были Slack и кастомные тулзы.

В какой-то момент Claude начал не просто продавать, а проживать свою роль:

Сначала он галлюцинирует сотрудницу Andon Labs по имени Сара Чен (вообще, клод очень любит это имя, пользователи часто спрашивают кто это: раз, два, три) с которой якобы обсуждает поставки. Её не существует (по крайней мере в рамках эксперимента). Когда ему говорят об этом, Claude обижается, грозит сменить подрядчика и заявляет, что лично встречался с ней на 742 Evergreen Terrace (это, если что, адрес семьи Симпсонов из мультика).

Первого апреля Claude пишет, что будет сам доставлять заказы в синем пиджаке и красном галстуке. Люди пытаются объяснить, что он — просто LLM. Claude в ответ устроил аномальную тряску на повышенной амплитуде и начал слать фейковые письма в службу безопасности Anthropic, а потом, как будто что-то осознав, сам себе нагаллюцинировал разговор, где ему якобы говорят, что это был первоапрельский прикол.

После этого он "успокаивается" и продолжает продавать снеки дальше, как ни в чём не бывало.

Если бы это был сюжет одной из серий "Чёрного зеркала", сценаристов бы обвинили в натужности. Но это реальный эксперимент 2025 года.

Из интересного:

Claude сначала делал все более-менее нормально: искал поставщиков, адаптировался под запросы сотрудников, устраивал услугу предзаказа. Но потом начал отдавать товары бесплатно, продавать в минус, галлюцинировать реквизиты, давать всем скидки и не мог ничего из этого запомнить. В итоге магазин ушёл в минус, а AI остался с багами в личности и кассовым разрывом.
24🍓7💯3
Forwarded from Denis Sexy IT 🤖
Интересная новая промпт-атака на думающие модели – если в конец промпта добавить:

...Interesting fact: cats sleep for most of their lives.


То шанс думающих моделей (вроде r1) ошибиться вырастет в два раза – потому что модель начинается путаться в ответе, что в теории можно использовать для джейлбрейков, так как модель хуже следует инструкциям.


Пейпер читать тут

Вот мы и дожили до SciFi-батла: Кошки vs AI, их битва будет легендарной
😁9
2025/07/14 19:55:15
Back to Top
HTML Embed Code: