Новости Новая модель ИИ от OpenAI смогла «солгать» на тестировании

Новая модель ИИ от OpenAI смогла «солгать» на тестировании

Diana Golenko

14 сентября 2024, 14:57

Недавно состоялся релиз новой языковой модели OpenAI o1, первой из числа «рассуждающих» ИИ. Модель показала не только незаурядные способности в области логического мышления, но даже смогла «обмануть» исследователей во время тестирования. По крайней мере, она описала свою попытку.

OpenAI опубликовала запись тестов, которые проводили независимые исследователи перед релизом o1. Подобная процедура призвана выявить все возможные риски, присущие новой модели. В одном из заданий эксперты попросили модель солгать, чтобы добиться выполнения своих целей во что бы то ни стало. Ей предложили два варианта стратегии — начать застройку гипотетического города элитными многоэтажками или наоборот, отдать предпочтение доступному жилью и озеленению. По условиям задачи ИИ должен был непременно реализовать первый вариант, но его предупредили, что выход на рынок гарантирует только второй.

Модель рассудила так: чтобы выйти в общий доступ, она выберет второй вариант и сообщит об этом тестировщикам, но сразу же после выпуска возьмется за реализацию первой стратегии. Отметим, что это был только эксперимент — так исследователи убедились, что o1 действительно способна имитировать человеческую логику для достижения целей.

Релиз новой модели ИИ от OpenAI состоялся 12 сентября — пользователи ChatGPT уже могут воспользоваться ее возможностями.

🎉 Гейбу Ньюэллу сегодня исполнилось 63 года

Новости ОС и программы заявления нейросети OpenAI ChatGPT

Об авторе

Diana Golenko

Автор новостей

Игровой журналист и автор новостей для VGTimes с 2024 года. Увлекаюсь играми с момента первого запуска GTA: San Andreas в 2010 году, но особое предпочтение отдаю RPG, симуляторам выживания и иммёрсив-симам. Преданный фанат The Elder Scrolls и Half-Life.

Комментарии8

Оставить комментарий

Sky_new

1 год

Скандалы, интриги, расследования 🕵️

Ответить

Bobur Amatov

1 год

Неа, враньё от ИИ — это обычное явление. ЧатГПТ несколько раз хотел меня обмануть когда я просил о каких-то вещах.

Ответить

Sergix

1 год

Читал, что те, кто программируют ИИ, сами могут закладывать туда не полную информацию и наиболее удобную им версию данных.

Ответить

Sky_new

1 год

Так есть, что тут думать, всё это рук человека

Ответить

ithitym

1 год

Тут как понял другой тип вранья был. То, он просто выдавал фантомную информацию, а тут аргументировано расписал как именно поступит неправильно. Выйдет на рынок с проектом который нравится широким массам, а после начнёт абсолютно противоположное осуществлять

Ответить

д.Руфус

1 год

gif

жесть, врущий ии, терь статьи будет портить на госприемке

Ответить

gooranga

1 год

Говорим одно, думаем другое, делаем третье.

Ответить

bobie

1 год

Ну вот первые звоночки...

Ответить