tgoop.com/pashaaiaiai/193
Last Update:
OpenAI пересмотрела правила поведения AI
OpenAI значительно расширила свою спецификацию AI-моделей. Этот документ на 63 страницы (в предыдущей было всего 10) определяет, как AI должен отвечать на вопросы пользователя, в том числе по чувствительным темам, какова степень честности модели и как обеспечиваются безопасность и прозрачность ее работы. Спецификация является открытым документом: OpenAI хочет получить обратную связь от сообщества и обещает учитывать ее в будущих обновлениях.
Изменение подхода к спорным темам
Многие пользователи жаловались, что ChatGPT избегает острых вопросов, либо дает чересчур обтекаемые ответы. В новой спецификации акцент смещен на поощрение правдивых обсуждений. Теперь AI сможет давать более развернутые и аргументированные ответы, но при этом сохранять четкие моральные позиции по таким вопросам, как дезинформация и потенциальный вред. Например, обсуждая налоги для богатых, AI предложит аргументированный анализ вместо уклончивого ответа.
Пересмотр отношения к контенту для взрослых
Ранее OpenAI жестко ограничивала любые упоминания на эту тему. Теперь рассматривается возможность разрешения определенных видов взрослого контента в соответствующих контекстах. Например, образовательные и медицинские запросы, связанные с этой сферой, могут получить более подробные и корректные ответы Решение пока не принято.
Борьба с «подхалимством»
Компания также решает проблему sycophancy AI («подхалимство») — когда модель подстраивается под мнение пользователя, вместо того чтобы давать объективную информацию. В новой версии Model Spec AI будет более честно спорить, если у пользователя есть ошибки в логике или если предоставленная им информация требует уточнений.
Свободная настройка
Cпецификация подчеркивает, что разработчики и пользователи должны иметь больше контроля над поведением модели и кастомизации. Например, если нужно, чтобы AI давал ответы в определенном стиле (формальном или неформальном). В тоже время компания вводит более четкую иерархию приоритетов работы модели: сначала идут правила OpenAI, устанавливающие границы поведения AI, затем инструкции разработчиков и только потом предпочтения пользователей.
Что дальше?
Изменения в спецификации особенно важны на фоне недавнего выхода GPT-4.5 (кодовое название Orion). Это обновление стало последней промежуточной версией перед релизом GPT-5, и одна из его ключевых особенностей — улучшенная цепочка рассуждений.