Новости Бесплатный DeepSeek R1 резко прибавил в логике и почти догнал платный ChatGPT

Бесплатный DeepSeek R1 резко прибавил в логике и почти догнал платный ChatGPT

DoubleA
Читать в полной версии

Команда DeepSeek тихо выпустила весомое обновление для своего бесплатного ИИ-ассистента R1. Хотя разработчики скромно называют его «минорным», тесты показывают серьезный рывок в способности решать сложные задачи.

Главное улучшение — усиление логики и научного мышления. Обновленная модель R1-0528 теперь справляется с олимпиадной математикой почти в 9 случаях из 10. Для сравнения: в январе этот показатель был заметно ниже. Особенно впечатляет прогресс в сверхсложном тесте Humanity's Last Exam, где результат R1 вырос более чем вдвое — до 17,7%. Хотя тест по-прежнему ставит в тупик большинство нейросетей.

В шести независимых тестах (наука, программирование, сложная математика) обновленный R1 показал результаты, очень близкие к платному ChatGPT-o3 от OpenAI. Отрыв минимален везде, кроме одного теста по кодингу. Разработчики утверждают, что модель стала реже выдавать недостоверную информацию. Пока доступ к аналогичным возможностям ChatGPT-o3 стоит от $20 (около 1 500 рублей) в месяц, DeepSeek R1 по-прежнему открыт для всех без оплаты.

Улучшения достигнуты не за счет увеличения размера модели, а благодаря перераспределению ресурсов на «дообучение» — прокачку именно навыков рассуждения и анализа. Обновление мгновенно оценили пользователи: мобильное приложение DeepSeek снова взлетело на первые места в магазинах приложений США, Великобритании, Японии, Южной Кореи и Китая.

Бесплатный китайский ассистент сделал серьезный шаг вперед, сократив отрыв от лидера рынка. Пока OpenAI сохраняет преимущество в мультимодальности (работа с картинками, голосом), DeepSeek R1 становится все привлекательнее для тех, кому нужны именно глубокий анализ и решение сложных задач без подписки.

🔞 Секс-сцены и много насилия: Ghost of Yotei получила рейтинг 19+ в Южной Корее
Комментарии 2
Оставить комментарий
2 дня
Скайнет близко? кто то в курсе)?
Ответить
2 дня
Насчёт скайнета не в курсе, но вот дел наворотить используя ИИ уже можно
Ответить