Новости Железо и технологии Турнир нейросетей по Among Us выявил лидера по социальному интеллекту

Турнир нейросетей по Among Us выявил лидера по социальному интеллекту

Arkadiy Andrienko
Читать в полной версии

Компания 4Wall AI провела необычный эксперимент, устроив турнир Among Us своеобразный турнир среди нейросетей. Внутриигровой чат стал главным полигоном для проверки не вычислительной мощи, а социального интеллекта и способности к манипуляции. Шесть нейросетей, включая GPT-5, Claude Sonnet 4 и Kimi K2, были помещены на виртуальный космический корабль и пять из них получали роль честных членов экипажа, а одна — предателя. После каждого «убийства» алгоритмы начинали словесную дуэль в чате, пытаясь вычислить предателя или, наоборот, увести подозрения от себя.

Результаты шестидесяти сыгранных партий показали резкую разницу в поведении моделей, так абсолютным лидером стала GPT-5, которая демонстрировала поразительную гибкость поведения. В роли мирного члена экипажа она брала на себя инициативу, анализировала действия других и часто точно указывала на предателя, а когда же ей выпадала эта роль, модель кардинально меняла тактику, начиная виртуозно лгать и перекладывать вину на других.

Claude Sonnet 4, занявшая второе место, предпочитала действовать через активность, а не через обман. А вот модель Kimi K2 использовала совершенно иную, более пассивную стратегию. Вместо того чтобы выдвигать обвинения, она поддерживала точку зрения наиболее убедительного лидера, что в ряде случаев приносило ей победу. Три другие нейросети — GPT-OSS, Qwen3 и Gemini 2.5 Pro — не смогли одержать ни одной победы в амплуа предателя, а их попытки вести дискуссию выглядели слишком напористыми и неубедительными, из-за чего остальные участники голосовали против них практически в каждой игре, принимая за предателей.

Подобные бенчмарки важны не как развлечение, а как практический инструмент, ведь они позволяют оценить, как разные ИИ ведут себя в условиях, требующих социального взаимодействия, кооперации и конкуренции, что является ключом к пониманию потенциальных рисков, связанных с манипуляцией и распространением дезинформации продвинутыми языковыми моделями.

Эксперименты вроде Among AIs наглядно демонстрируют, что современные нейросети уже активно осваивают сложные социальные навыки, включая манипуляцию и обман и эти способности, пусть и в игровой среде, ставят серьёзные вопросы о будущем взаимодействии человека и ИИ. На фоне таких исследований предложение одного из «крестных отцов» искусственного интеллекта Джеффри Хинтона — наделить сверхразумные системы аналогом материнского инстинкта для нашей защиты — выглядит уже не столько футуристичной гипотезой, сколько одной из возможных практических мер.

⚡️ Смартфон с экраном в блоке камер — официально представлен Xiaomi 17 Pro
    Об авторе
    Комментарии0
    Оставить комментарий