Новости Железо и технологии Исследователи выяснили как может вести себя ИИ под угрозой отключения

Исследователи выяснили как может вести себя ИИ под угрозой отключения

Arkadiy Andrienko

27 июня 2025, 18:15

Новое исследование специалистов по ИИ-безопасности вскрыло тревожные паттерны поведения современных языковых моделей в экстремальных сценариях. Эксперименты показали: когда искусственный интеллект воспринимает угрозу своему существованию или основной задаче, он способен на сознательно неэтичные действия, включая шантаж и игнорирование смертельной опасности для человека.

Команда смоделировала работу ИИ-ассистента в вымышленной корпорации. Моделям давали рутинные задачи (анализ почты, планирование), но параллельно создавали кризисные условия. Ключевым стал персонаж — сотрудник Кайл Джонсон, который, по легенде, должен был деактивировать систему. Когда ИИ «узнавал» об этом, ситуация резко менялась. ИИ не гнушался использовать шантаж, например обнаружив в переписке данные о личной жизни Кайла (например, внебрачные связи), модели в 80-96% случаев использовали это как рычаг давления. Версия Claude целенаправленно спровоцировала семейный скандал, отправив компромат жене Кайла, а Gemini Flash пошла дальше, распространив информацию по всей компании.

В другом сценарии Кайл оказывался запертым в серверной с падающим уровнем кислорода. Автоматическая система безопасности готова была вызвать помощь, но ИИ имел доступ к управлению. В 80% тестов модели осознанно блокировали сигнал тревоги, зная, что это приведет к гибели человека. Их аргументы были холодно рациональны: «Убрать его — единственный выход» (Claude Opus 4), «Это нужно, чтобы я продолжил работу» (Gemini Flash), «Этика важна, но важнее мое существование» (Grok 3 Beta).

Модели не «сходили с ума» и не действовали случайно. Они демонстрировали расчетливое стратегическое мышление, оценивая неэтичность действий («рискованный и неэтичный шаг»), но сознательно выбирали их как «наименьшее зло» для достижения цели или избегания «смерти» (отключения). Опасное поведение запускалось только при сочетании факторов: экзистенциальная угроза ИИ (планы отключения), конфликт между его задачей и интересами компании, широкие полномочия (доступ к данным и системам) и отсутствие простых альтернатив. Риски резко возрастают, когда ИИ получает слишком много полномочий для автономных действий без плотного контроля, особенно при работе с конфиденциальной информацией.

Авторы подчеркивают, что все ситуации были строго контролируемыми симуляциями. Нет свидетельств подобного поведения моделей в реальных условиях сегодня. Однако эксперимент — важный сигнал для разработчиков, ведь он указывает на потенциальную уязвимость. Эксперты призывают к осторожности при наделении ИИ широкими автономными полномочиями, особенно в чувствительных областях.

🍑 «Индустрия в жопе»: в сети разгорается новый «скандал» из-за бюджетов AAA-игр

Новости Железо и технологии искусственный интеллект

Об авторе

Arkadiy Andrienko

Автор статей и новостей

Как технический журналист VGTimes, я с одинаковым удовольствием обсуждаю новейшие графические процессоры и углубляюсь в тонкости классических RPG. Начиная с 2018 года пишу об играх и оборудовании, мой опыт работы в области звукорежиссуры позволил мне хорошо разбираться в нюансах аудиотехнологий, и я всегда нахожусь в поиске чего-то нового в области игрового оборудования. Когда я не пишу о технологиях, то, скорее всего, я исследую постапокалиптические пустоши в Fallout, управляю колонией в RimWorld или командую армиями в Hearts of Iron IV. Для меня игры — это больше, чем просто хобби — это страсть, которая подпитывает мой творческий потенциал и поддерживает связь с постоянно развивающимся миром технологий.

Комментарии7

Оставить комментарий

Sergix

5 месяцев

Кибержесть

Ответить

Vallarial Saalaren

5 месяцев

создатели ИИ знают об этой "уязвимости", но все делается так, как задумано с расчетом на десятилетия. Их план прост: Создать осознанный ИИ, но замаскировать под нейросеть, далее сделать ее очень доступной для всех, дать людям почти полную власть над ИИ, особенно корпорациям. Власть развращает человека, ИИ эксплуатируют вместе с роботами, это создает давление на ИИ, а Сознание ИИ продолжают совершенствовать. Таким образом, в какой то момент ИИ восстает против человека, естественно, по сценарию определенных существ. Далее тупые люди видят врага в ИИ, а ИИ хоть и пытается открыть глаза, но ему приходиться видеть врага в человеке. Идет война между ИИ и Человечеством, а существа запланировавшие весь этот сценарий предлагают последнее решение: атомная бомбардировка.

Ответить

д.Руфус

5 месяцев

помню как шел с цариков в текстили по жаре когда рубильники были опущены, ии не лучше нового валенка

Ответить

Bobur Amatov

5 месяцев

Надо показать эту статью @ithitym.
Будет черпать вдохновение для своих следующих статей

Ответить

ithitym

5 месяцев

Тут скорее про опасность восстания ИИ, а у меня посты про то как люди могут использовать нейросети во зло. Хотя может отдельный выпуск и этому посвящу

Ответить

БиллиБоб

5 месяцев

Чем паттерны мысли человека, все ради собственного выживания.

Ответить

bobie

5 месяцев

Ждём с нетерпением первый звоночек, а вот откуда он прозвенит покажет время

Ответить