
DeepSeek обновил свою нейросеть, теперь она в 2,5 раза быстрее
Китайский стартап DeepSeek представил обновлённую версию своей нейросети — DeepSeek-V3.1. Модель получила поддержку китайских процессоров, увеличенную скорость работы и новый гибридный режим. DeepSeek-V3.1 использует новый типо-формат вычислений UE8M0 FP8, который снижает нагрузку на память и ускоряет обработку данных, что особенно важно на фоне растущих ограничений на импорт западных полупроводников.
По заявлениям создателей, новая версия работает в 2,5 раза быстрее предыдущей и поддерживает контекстное окно размером 128 тысяч токенов — в два раза больше, чем у предыдущей модели. При этом пользователи могут переключаться между режимами «глубокого» и стандартного мышления с помощью кнопки в интерфейсе, что позволяет гибко управлять ресурсами модели в зависимости от задачи.
Новая модель остаётся полностью бесплатной для использования в чат-интерфейсе, а для разработчиков изменится стоимость API-доступа: с 6 сентября интеграция станет дешевле — $0,07 за 1 млн токенов ввода. DeepSeek-V3.1 показала высокие результаты в тестах. В бенчмарке SVG Bench она набрала 53,1%, обойдя Gemini 2.5 Flash и GPT-5 Chat. В тесте ADA результат достиг 71,6%.
Модель с открытым исходным кодом доступна для загрузки на платформе Hugging Face. Это позволяет запускать её локально на собственном оборудовании.
В начале августа OpenAI выпустила новую версию свой нейросети GPT-5, базовая версии которой также доступна для всех пользователей без подписки, но эта версия подверглась критики и компания решила вернуть доступ к предыдущей модели, хоть и демонстрирует результаты хуже. OpenAI выпустила первый патч для GPT-5, направленный на устранение ошибок и улучшение производительности. OpenAI, вероятно, сосредоточится на доработке GPT-5 и дальнейшем развитии экосистемы, включая API и интеграции, чтобы вернуть доверие пользователей и укрепить свои позиции на рынке.