Новая модель ИИ от OpenAI смогла «солгать» на тестировании
Недавно состоялся релиз новой языковой модели OpenAI o1, первой из числа «рассуждающих» ИИ. Модель показала не только незаурядные способности в области логического мышления, но даже смогла «обмануть» исследователей во время тестирования. По крайней мере, она описала свою попытку.
OpenAI опубликовала запись тестов, которые проводили независимые исследователи перед релизом o1. Подобная процедура призвана выявить все возможные риски, присущие новой модели. В одном из заданий эксперты попросили модель солгать, чтобы добиться выполнения своих целей во что бы то ни стало. Ей предложили два варианта стратегии — начать застройку гипотетического города элитными многоэтажками или наоборот, отдать предпочтение доступному жилью и озеленению. По условиям задачи ИИ должен был непременно реализовать первый вариант, но его предупредили, что выход на рынок гарантирует только второй.
Модель рассудила так: чтобы выйти в общий доступ, она выберет второй вариант и сообщит об этом тестировщикам, но сразу же после выпуска возьмется за реализацию первой стратегии. Отметим, что это был только эксперимент — так исследователи убедились, что o1 действительно способна имитировать человеческую логику для достижения целей.
Релиз новой модели ИИ от OpenAI состоялся 12 сентября — пользователи ChatGPT уже могут воспользоваться ее возможностями.
-
OpenAI собирается выпустить собственный процессор для конкуренции с NVIDIA
-
«Век интеллекта»: создатель OpenAI предсказал появление сверхразума и космических колоний
-
OpenAI: число пользователей ChatGPT достигло 200 миллионов человек в неделю
-
Новая модель ChatGPT сумела за час написать код для докторской диссертации
-
OpenAI обеспокоена симпатией пользователей к голосовому режиму ChatGPT
-
OpenAI выпустила продвинутую модель o1: искусственный интеллект нового уровня
-
СМИ: Apple и NVIDIA собираются инвестировать в OpenAI
-
OpenAI запускает расширенного голосового помощника ChatGPT. В сети уже показали, как он имитирует пьяную речь