Турнир нейросетей по Among Us выявил лидера по социальному интеллекту

Турнир нейросетей по Among Us выявил лидера по социальному интеллекту

Arkadiy Andrienko

Компания 4Wall AI провела необычный эксперимент, устроив турнир Among Us своеобразный турнир среди нейросетей. Внутриигровой чат стал главным полигоном для проверки не вычислительной мощи, а социального интеллекта и способности к манипуляции. Шесть нейросетей, включая GPT-5, Claude Sonnet 4 и Kimi K2, были помещены на виртуальный космический корабль и пять из них получали роль честных членов экипажа, а одна — предателя. После каждого «убийства» алгоритмы начинали словесную дуэль в чате, пытаясь вычислить предателя или, наоборот, увести подозрения от себя.

Результаты шестидесяти сыгранных партий показали резкую разницу в поведении моделей, так абсолютным лидером стала GPT-5, которая демонстрировала поразительную гибкость поведения. В роли мирного члена экипажа она брала на себя инициативу, анализировала действия других и часто точно указывала на предателя, а когда же ей выпадала эта роль, модель кардинально меняла тактику, начиная виртуозно лгать и перекладывать вину на других.

Claude Sonnet 4, занявшая второе место, предпочитала действовать через активность, а не через обман. А вот модель Kimi K2 использовала совершенно иную, более пассивную стратегию. Вместо того чтобы выдвигать обвинения, она поддерживала точку зрения наиболее убедительного лидера, что в ряде случаев приносило ей победу. Три другие нейросети — GPT-OSS, Qwen3 и Gemini 2.5 Pro — не смогли одержать ни одной победы в амплуа предателя, а их попытки вести дискуссию выглядели слишком напористыми и неубедительными, из-за чего остальные участники голосовали против них практически в каждой игре, принимая за предателей.

Подобные бенчмарки важны не как развлечение, а как практический инструмент, ведь они позволяют оценить, как разные ИИ ведут себя в условиях, требующих социального взаимодействия, кооперации и конкуренции, что является ключом к пониманию потенциальных рисков, связанных с манипуляцией и распространением дезинформации продвинутыми языковыми моделями.

Эксперименты вроде Among AIs наглядно демонстрируют, что современные нейросети уже активно осваивают сложные социальные навыки, включая манипуляцию и обман и эти способности, пусть и в игровой среде, ставят серьёзные вопросы о будущем взаимодействии человека и ИИ. На фоне таких исследований предложение одного из «крестных отцов» искусственного интеллекта Джеффри Хинтона — наделить сверхразумные системы аналогом материнского инстинкта для нашей защиты — выглядит уже не столько футуристичной гипотезой, сколько одной из возможных практических мер.

💍 Страшно: аккумулятор умного кольца Samsung вздулся прямо на пальце — девайс невозможно было снять
    Об авторе
    Комментарии0