Новости OpenAI выпустила продвинутую модель o1: искусственный интеллект нового уровня

OpenAI выпустила продвинутую модель o1: искусственный интеллект нового уровня

DoubleA
Читать в полной версии

Основное отличие o1 от предыдущих версий ИИ заключается в её способности к логическому мышлению и анализу. В отличие от GPT-4o, который в основном полагается на поиск ответов в базе данных, o1 имитирует человеческий процесс мышления: она разбивает задачи на отдельные шаги, рассматривает различные подходы и исправляет свои собственные ошибки. Это делает её гораздо более эффективной в решении сложных задач, требующих последовательного анализа и логического рассуждения.

Модель продемонстрировала выдающиеся результаты на тестах, предназначенных для оценки умственных способностей. В частности, на квалификационном этапе Международной математической олимпиады (IMO), o1 справилась с 83% задач, что значительно превосходит результаты GPT-4o, который правильно решил только 13%. В тестах на программирование модель заняла 49-е место на Международной олимпиаде по информатике (IOI) и показала превосходство над 89% участников платформы Codeforces.

Модель прошла сложный тест GPQA diamond, который оценивает знания в таких областях, как химия, физика и биология. В результате, o1 показала уровень, сопоставимый с докторами наук, хотя разработчики подчёркивают, что это не означает её превосходство над всеми специалистами, а лишь её способность решать некоторые задачи на высочайшем уровне.

Ключом к успеху новой модели стал принципиально новый алгоритм обучения, известный как «цепочка мыслей». Этот подход позволяет o1 продумывать свои решения более глубоко, прибегая к методу обучения с подкреплением, что даёт возможность нейросети не только исправлять собственные ошибки, но и оптимизировать процесс решения задач, пробуя разные стратегии.

Однако, несмотря на все преимущества, у модели o1 есть и свои недостатки. Она менее эффективна при работе с энциклопедическими знаниями по сравнению с GPT-4o и не может обрабатывать веб-страницы, файлы и изображения, кроме того, её вычислительные процессы медленнее, а стоимость использования выше.

OpenAI уже сделала модель o1 доступной в превью-версии для пользователей ChatGPT и разработчиков через API. Помимо основной модели, OpenAI представила облегчённую версию — o1-mini, которая ориентирована на задачи, связанные с программированием, предлагая более лёгкую и доступную альтернативу для разработчиков.

❌ Роскомнадзор угрожает лишнием лицензии провайдерам, ускоряющим YouTube
Комментарии 18
Оставить комментарий
5 часов

Где опробовать? Пару дней назад дал ChatGPT несложное задание перевести периодичную дробь в обыкновенную. Тоже показывала ход решения, но в итоге промахнулась.

Ответить
5 часов

А какой был пример и какой верный ответ? В группе помню писали, но искать слишком долго

Ответить
5 часов

В чате рассказывал недавно, пролистаю — гляну. Задание: Переведи периодичную дробь 5.2(45) в обыкновенную дробь. Выдал в ответе: Итак, периодическая дробь ( 5.2(45) ) в виде обыкновенной дроби равна ( frac{229}{44} ). Надо понимать как 229/44. Это 5.20(45).

Ответить
5 часов

В ответе внутри скобок обратный слеш, при отправке комментария здесь он пропадает.

Ответить
5 часов

А правильный ответ какой?

Ответить
4 часа

577/110.

Ответить
4 часа

Копилот выдал верную пропорцию, но число в три раза больше. Когда я спросил почему не выдал 577 на 110, он ответил

Показать спойлерСкрыть спойлер
Ответить
4 часа

Спрячь решение за спойлер, а то модер полотно удалит, по своим комментам знаю точно.

Ответить
4 часа

В тот же день спрашивал у Копилота.

Показать спойлерСкрыть спойлер

Тоже ошибся.

Ответить
4 часа
выдал верную пропорцию, но число в три раза больше

Не понял, как это.

Ответить
4 часа

Выдал 1731 на 330

Ответить
3 часа

У меня есть подозрения в неправильном составлении запросов, поэтому получил неправильные ответы.

Ответить
3 часа

Вполне возможно. Тем более она же сначала переводит всё на английский, а потом отвечает, снова переводя на русский

Ответить
3 часа

На русском же можно. Ваши запросы на русском были?

Ответить
2 часа

Да, на русском. Но нейросеть сама переводит запросы на английский, их обрабатывает, составляет ответ и его переводит на русский.
З.ы. тут ошибся. Копилот напрямую обрабатывает запрос. Значит спутал с чатGPT

Ответить
5 часов

И восстали машины из пепла ядерного огня...

Ответить
1 час

до этого сценария еще долго

Ответить
42 минуты

Думаешь?

Ответить