Бесплатный DeepSeek R1 резко прибавил в логике и почти догнал платный ChatGPT

Команда DeepSeek тихо выпустила весомое обновление для своего бесплатного ИИ-ассистента R1. Хотя разработчики скромно называют его «минорным», тесты показывают серьезный рывок в способности решать сложные задачи.

Главное улучшение — усиление логики и научного мышления. Обновленная модель R1-0528 теперь справляется с олимпиадной математикой почти в 9 случаях из 10. Для сравнения: в январе этот показатель был заметно ниже. Особенно впечатляет прогресс в сверхсложном тесте Humanity's Last Exam, где результат R1 вырос более чем вдвое — до 17,7%. Хотя тест по-прежнему ставит в тупик большинство нейросетей.

В шести независимых тестах (наука, программирование, сложная математика) обновленный R1 показал результаты, очень близкие к платному ChatGPT-o3 от OpenAI. Отрыв минимален везде, кроме одного теста по кодингу. Разработчики утверждают, что модель стала реже выдавать недостоверную информацию. Пока доступ к аналогичным возможностям ChatGPT-o3 стоит от $20 (около 1 500 рублей) в месяц, DeepSeek R1 по-прежнему открыт для всех без оплаты.

Улучшения достигнуты не за счет увеличения размера модели, а благодаря перераспределению ресурсов на «дообучение» — прокачку именно навыков рассуждения и анализа. Обновление мгновенно оценили пользователи: мобильное приложение DeepSeek снова взлетело на первые места в магазинах приложений США, Великобритании, Японии, Южной Кореи и Китая.

Бесплатный китайский ассистент сделал серьезный шаг вперед, сократив отрыв от лидера рынка. Пока OpenAI сохраняет преимущество в мультимодальности (работа с картинками, голосом), DeepSeek R1 становится все привлекательнее для тех, кому нужны именно глубокий анализ и решение сложных задач без подписки.

🍑 Они трясутся как желе: в The First Descendant добавили физику груди и попы
+4
Комментарии 2