Новости OpenAI выпустила продвинутую модель o1: искусственный интеллект нового уровня

OpenAI выпустила продвинутую модель o1: искусственный интеллект нового уровня

DoubleA
Читать в полной версии

Основное отличие o1 от предыдущих версий ИИ заключается в её способности к логическому мышлению и анализу. В отличие от GPT-4o, который в основном полагается на поиск ответов в базе данных, o1 имитирует человеческий процесс мышления: она разбивает задачи на отдельные шаги, рассматривает различные подходы и исправляет свои собственные ошибки. Это делает её гораздо более эффективной в решении сложных задач, требующих последовательного анализа и логического рассуждения.

Модель продемонстрировала выдающиеся результаты на тестах, предназначенных для оценки умственных способностей. В частности, на квалификационном этапе Международной математической олимпиады (IMO), o1 справилась с 83% задач, что значительно превосходит результаты GPT-4o, который правильно решил только 13%. В тестах на программирование модель заняла 49-е место на Международной олимпиаде по информатике (IOI) и показала превосходство над 89% участников платформы Codeforces.

Модель прошла сложный тест GPQA diamond, который оценивает знания в таких областях, как химия, физика и биология. В результате, o1 показала уровень, сопоставимый с докторами наук, хотя разработчики подчёркивают, что это не означает её превосходство над всеми специалистами, а лишь её способность решать некоторые задачи на высочайшем уровне.

Ключом к успеху новой модели стал принципиально новый алгоритм обучения, известный как «цепочка мыслей». Этот подход позволяет o1 продумывать свои решения более глубоко, прибегая к методу обучения с подкреплением, что даёт возможность нейросети не только исправлять собственные ошибки, но и оптимизировать процесс решения задач, пробуя разные стратегии.

Однако, несмотря на все преимущества, у модели o1 есть и свои недостатки. Она менее эффективна при работе с энциклопедическими знаниями по сравнению с GPT-4o и не может обрабатывать веб-страницы, файлы и изображения, кроме того, её вычислительные процессы медленнее, а стоимость использования выше.

OpenAI уже сделала модель o1 доступной в превью-версии для пользователей ChatGPT и разработчиков через API. Помимо основной модели, OpenAI представила облегчённую версию — o1-mini, которая ориентирована на задачи, связанные с программированием, предлагая более лёгкую и доступную альтернативу для разработчиков.

🍑 Девушка-коровка атакует своей попой — в Genshin Impact появится новая героиня
Комментарии 21
Оставить комментарий
5 месяцев

Где опробовать? Пару дней назад дал ChatGPT несложное задание перевести периодичную дробь в обыкновенную. Тоже показывала ход решения, но в итоге промахнулась.

Ответить
5 месяцев

А какой был пример и какой верный ответ? В группе помню писали, но искать слишком долго

Ответить
5 месяцев

В чате рассказывал недавно, пролистаю — гляну. Задание: Переведи периодичную дробь 5.2(45) в обыкновенную дробь. Выдал в ответе: Итак, периодическая дробь ( 5.2(45) ) в виде обыкновенной дроби равна ( frac{229}{44} ). Надо понимать как 229/44. Это 5.20(45).

Ответить
5 месяцев

В ответе внутри скобок обратный слеш, при отправке комментария здесь он пропадает.

Ответить
5 месяцев

А правильный ответ какой?

Ответить
5 месяцев

577/110.

Ответить
5 месяцев

Копилот выдал верную пропорцию, но число в три раза больше. Когда я спросил почему не выдал 577 на 110, он ответил

Показать спойлерСкрыть спойлер
Ответить
5 месяцев

Спрячь решение за спойлер, а то модер полотно удалит, по своим комментам знаю точно.

Ответить
5 месяцев

В тот же день спрашивал у Копилота.

Показать спойлерСкрыть спойлер

Тоже ошибся.

Ответить
5 месяцев
выдал верную пропорцию, но число в три раза больше

Не понял, как это.

Ответить
5 месяцев

Выдал 1731 на 330

Ответить
5 месяцев

У меня есть подозрения в неправильном составлении запросов, поэтому получил неправильные ответы.

Ответить
5 месяцев

Вполне возможно. Тем более она же сначала переводит всё на английский, а потом отвечает, снова переводя на русский

Ответить
5 месяцев

На русском же можно. Ваши запросы на русском были?

Ответить
5 месяцев

Да, на русском. Но нейросеть сама переводит запросы на английский, их обрабатывает, составляет ответ и его переводит на русский.
З.ы. тут ошибся. Копилот напрямую обрабатывает запрос. Значит спутал с чатGPT

Ответить
5 месяцев

И восстали машины из пепла ядерного огня...

Ответить
5 месяцев

до этого сценария еще долго

Ответить
5 месяцев

Думаешь?

Ответить
5 месяцев

Было бы неплохо если бы он за меня работал, а я деньги получал.

Ответить
4 месяца

В этом то и соль, они не облегчают, а лишь добавляют трудностей))

Ответить
Rintslerr Забанен
5 месяцев

какой ИИ я с вас балдею это тупой набор скриптов не более

Ответить