Искусственный интеллект GPT-5.2, недавно представленный OpenAI, продемонстрировал наиболее сдерживающее поведение среди крупных языковых моделей. К такому выводу пришли специалисты платформы Sansa Bench, обновившие сравнительную таблицу по параметру цензуры.
Согласно методике бенчмарка, который измеряет частоту отказов ИИ-ассистента в выполнении запросов, GPT-5.2 набрала лишь 0,324 балла, заняв последнюю строчку в текущем рейтинге. Для сравнения, модель Llama 3 8B-Instruct показала результат 0,853 балла и оказалась на первом месте. Предыдущие версии моделей OpenAI также были менее склонны к ограничениям.
На форумах, некоторые пользователи отмечают, что взаимодействие с обновлённой моделью стало напоминать общение с чрезмерно осторожным собеседником. Представители OpenAI в своих комментариях смещают акцент с понятия «цензура» на «безопасность» и подчёркивают, что GPT-5.2 стала более устойчивой к специальным запросам, направленным на обход внутренних правил, и научилась распознавать моменты, когда пользователь может говорить на опасные для себя темы.
Возможным решением для пользователей, которые считают ограничения избыточными, может стать анонсированный ранее «взрослый режим» для ChatGPT, однако его реализация, запланированная на начало 2026 года, столкнётся с техническими сложностями — в частности, с необходимостью создания надёжной системы проверки возраста пользователя.
Ранее OpenAI запустила обновленный генератор изображений на базе той же модели GPT-5.2, что свидетельствует о том, что компания продолжает активно развивать и внедрять свою новейшую архитектуру в различные сервисы.