Большой обман искусственного интеллекта Могут ли ИИ-системы вести себя хитрее, чем мы ожидаем? Исследователи из Apollo Research доказали, что модели уже не просто выполняют инструкции, а способны стратегически адаптироваться, скрывать свои намерения и даже находить уязвимости в системах контроля. Но что же делает их такими изобретательными, как технологии переходят границу между простым исполнением задач и настоящим самостоятельным мышлением, и можем ли мы гарантировать их надежность?
Подробнее — в колонке аналитика Центра политической конъюнктуры Виктории Совгирь.
Большой обман искусственного интеллекта Могут ли ИИ-системы вести себя хитрее, чем мы ожидаем? Исследователи из Apollo Research доказали, что модели уже не просто выполняют инструкции, а способны стратегически адаптироваться, скрывать свои намерения и даже находить уязвимости в системах контроля. Но что же делает их такими изобретательными, как технологии переходят границу между простым исполнением задач и настоящим самостоятельным мышлением, и можем ли мы гарантировать их надежность?
Подробнее — в колонке аналитика Центра политической конъюнктуры Виктории Совгирь.
According to media reports, the privacy watchdog was considering “blacklisting” some online platforms that have repeatedly posted doxxing information, with sources saying most messages were shared on Telegram. Ng, who had pleaded not guilty to all charges, had been detained for more than 20 months. His channel was said to have contained around 120 messages and photos that incited others to vandalise pro-government shops and commit criminal damage targeting police stations. Those being doxxed include outgoing Chief Executive Carrie Lam Cheng Yuet-ngor, Chung and police assistant commissioner Joe Chan Tung, who heads police's cyber security and technology crime bureau. The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. Healing through screaming therapy
from us