Искусственный интеллект прошел IQ-тест — похоже, нейросети уже умнее среднестатистического человека
Исследователь Максим Лотт (Maxim Lott) проверил интеллект современных нейросетей, заставив их пройти IQ-тест. Результаты он опубликовал в своем блоге.
Для измерения блогер использовал адаптированную версию IQ-теста от норвежской компании Mensa. В оригинальном тесте все задачи сделаны в форме картинок, поэтому Лотту пришлось составить детальное текстовое описание каждой задачи. Каждый ИИ проходил тест дважды.
Результаты тестов представлены ниже. Самой умной нейросетью оказалась Claude-3, которая набрала 101 балл. Следом идут ChatGPT-4 с 85 баллами и Claude-2 с 82 баллами.
После всех тестов Максим Лотт сделал для себя несколько выводов. В первую очередь его сильно впечатлил прогресс Claude. Первая итерация нейросети набрала 64 балла (столько же можно набрать, выбирая ответ случайным образом), но вышедшая через 4 месяца Claude-2 стала заметно лучше. Исследователь полагает, что уже через год уровень интеллекта достигнет около 120 баллов.
Также Лотт отметил, что даже текущие результаты Claude превышают средний человеческий IQ. Похоже, что Илон Маск (Elon Musk) не зря беспокоится о слишком быстром прогрессе в обучении искусственного интеллекта.
В то же время некоторые эксперты сомневаются, что победу ИИ можно считать справедливой. Во-первых, нейросети прошли лишь один из множества IQ-тестов. Во-вторых, нейросети могли уже видеть часть теста Mensa во время обучения. В-третьих, IQ-тесты в основном проверяют способность к логическому мышлению и не говорят о том, насколько качественно нейросети решают задачи.
- Нейросеть показала, что если бы Шрека, Йоду и Спанч Боба добавили в Call of Duty
- Вышла новая версия нейросети, которая умеет создавать песни по описанию
- Новая нейросеть удивила «полностью сгенерированными» роликами, которые не отличить от реальных видео. Однако выяснилось, что это не так
-
Новая нейросеть удивила «полностью сгенерированными» роликами, которые не отличить от реальных видео. Однако выяснилось, что это не так
-
Нейросеть показала, что если бы Шрека, Йоду и Спанч Боба добавили в Call of Duty
-
Вышла новая версия нейросети, которая умеет создавать песни по описанию
-
Показаны скриншоты нового сюжетного мода для «Сталкера» со своими локациями, квестами и озвучкой
-
Названа самая ожидаемая ПК-игра мая в Steam. Она обогнала Ghost of Tsushima и Senua's Saga: Hellblade 2
-
Анонсирована новая откровенная фигурка Евы из Stellar Blade. Героиня одета в «прозрачный» костюм
-
Слух: первый взгляд на Красного Халка в фильме «Капитан Америка 4». Пока только в виде игрушки
-
Тысячи геймеров подписали петицию с требованием убрать цензуру из эротического экшена Stellar Blade
-
Будущее уже здесь: анонсирован первый конкурс красоты для виртуальных моделей
-
В Steam вышел изометрический «соулслайк» No Rest for the Wicked. Игра красивая, но неоптимизированная
-
Bethesda moment: крупный патч для Fallout 4 сломал поддержку модов на ПК
-
Свежие детали Kingdom Come: Deliverance 2: обновленные бои, десятки навыков и клеймо за серьезные преступления
-
Официально: пятый сезон сериала «Ведьмак» станет последним
-
Выходцы из BioWare показали необычного спутника из своей новой игры Exodus
-
В Steam стала доступна игра про Черепашек-ниндзя, которая 7 лет не выходила на ПК
-
Создатели постапокалиптического шутера Pioner рассказали о системе торговли
-
Хью Джекман отреагировал на пост c возможной отсылкой к Marvel's Wolverine в трейлере «Дэдпула и Росомахи»
-
Нейросеть показала свою версию аниме по «Звездным войнам» с Дартом Вейдером, Бобой Феттом, Люком и другими героями
-
Вышел новый геймплей Pneumata — хоррора от первого лица с графикой на Unreal Engine 5
-
Показан геймплей новой игры по аниме «О моём перерождении в слизь»