Новости Железо и технологии Почему нейросети врут: OpenAI объяснила природу галлюцинаций ИИ

Почему нейросети врут: OpenAI объяснила природу галлюцинаций ИИ

8 сентября 2025, 13:39 8 сентября 2025, 15:33

Команда исследователей из OpenAI подробно разобралась, почему языковые модели, подобные ChatGPT, иногда выдают вымышленные или ложные факты. Оказалось, проблема во многом кроется в самой системе их обучения и оценки, которая поощряет модели гадать, а не признавать отсутствие ответа.

Специалисты проводят аналогию со студентом на экзамене. Если за пустой ответ ставят ноль, а за угаданный вариант — хотя бы какой-то балл, то выбирать всегда выгоднее второе, так же и с искусственным интеллектом, ведь все тесты для оценки моделей, такие как MMLU, работают по бинарному принципу «правильно/неправильно». Модель, которая утверждает «не знаю», автоматически получает ноль, в то время как та, что рискует и угадывает, иногда оказывается права, таким образом алгоритмы учатся блефовать.

Данная проблема зарождается еще на этапе предобучения модели на больших массивах текста. Некоторые факты, особенно редкие, статистически почти невозможно предугадать абсолютно точно, однако окончательно паттерн к «угадыванию» закрепляется позже, когда разработчики натаскивают модель на прохождение тестов, поощряющих высокие баллы за точность.

В своем исследовании OpenAI предлагает изменить сам подход к оценке работы нейросетей, так по мнению авторов, нужно серьезно штрафовать модель за уверенную ложь, но при этом давать частичные баллы за корректное выражение неуверенности или ответ «не знаю». Это сместит фокус с создания «самых умных» моделей на разработку более надежных и правдивых ассистентов.

Эксперты подчеркивают, что галлюцинации — это не мистический сбой, а системная проблема, корни которой хорошо изучены, но даже современные продвинутые модели не застрахованы от этого и пересмотр систем оценки может стать ключом к созданию ИИ, который будет лучше осознавать границы своих знаний.

👀 Netflix дропнула первые 5 минут финального сезона «Очень странных дел»

Новости Железо и технологии OpenAI нейросети

Об авторе

Arkadiy Andrienko

Автор статей и новостей

Как технический журналист VGTimes, я с одинаковым удовольствием обсуждаю новейшие графические процессоры и углубляюсь в тонкости классических RPG. Начиная с 2018 года пишу об играх и оборудовании, мой опыт работы в области звукорежиссуры позволил мне хорошо разбираться в нюансах аудиотехнологий, и я всегда нахожусь в поиске чего-то нового в области игрового оборудования. Когда я не пишу о технологиях, то, скорее всего, я исследую постапокалиптические пустоши в Fallout, управляю колонией в RimWorld или командую армиями в Hearts of Iron IV. Для меня игры — это больше, чем просто хобби — это страсть, которая подпитывает мой творческий потенциал и поддерживает связь с постоянно развивающимся миром технологий.

...Развернуть

Комментарии3