Новости Новая модель DeepSeek V3-0324 бросает вызов GPT-4o и Claude-3.5

Новая модель DeepSeek V3-0324 бросает вызов GPT-4o и Claude-3.5

DoubleA
Читать в полной версии

Компания DeepSeek AI представила масштабное обновление своей флагманской модели — DeepSeek V3-0324. Модель, доступная на GitHub и Hugging Face, не только догоняет, но и превосходит по ряду параметров закрытые аналоги вроде GPT-4o и Claude-3.5-Sonnet.

В основе обновления — усовершенствованная архитектура Mixture-of-Experts (MoE), где 671 млрд параметров динамически активируются порциями по 37 млрд на токен. Технология Multi-head Latent Attention сокращает потребление памяти на 60%, а Multi-Token Prediction ускоряет генерацию текста в 1.8 раза. Модель «прокачали» на датасете, включающем математические задачи, код на 15 языках и научные работы. Обучение длилось 2.788 млн GPU-часов на кластерах H800, что эквивалентно 318 годам непрерывной работы одного ускорителя. Результат: 89.3% точности в решении школьных математических задач (GSM8K) и 65.2% успеха в генерации кода (HumanEval) — на 10-15% выше предыдущих open-source решений.

Обновление принесло неожиданные улучшения:

  • Генерация фронтенд-кода теперь создает визуально привлекательные интерфейсы;
  • Качество текстов сравнялось с человеческим уровнем в длинных эссе;
  • Точность вызова функций (function calling) достигла 92%, устраняя главную боль предыдущих версий.

Хотя официальное описание апдейта пока не опубликовано, но его вес составляет 700 ГБ. Модель доступна через API с уникальной системой «температурной калибровки»: стандартный параметр 1.0 автоматически преобразуется в оптимальные 0.3. Для локального запуска разработчики предлагают модифицированные шаблоны промптов с поддержкой поиска в сети и анализа файлов — функция, ранее доступная только в премиальных коммерческих решениях.

Эксперты прогнозируют, что DeepSeek V3-0324 может перевернуть рынок ИИ-ассистентов для программирования и анализа данных. При этом её открытость под MIT-лицензией открывает путь для кастомизации — от автоматизации бизнес-процессов до создания узкоспециализированных научных ассистентов.

😂 Илон Маск прошёлся по Assassin's Creed Shadows — Ubisoft прошлась по Маску в ответ
Комментарии 5
Оставить комментарий
3 дня
Этот Seek уже больше месяца обсуждают. Он не очень то и крут, но как альтернатива хорошо.
Ответить
3 дня
Не дип сик лучше чат гпт но у него база данных с 2023 не обновлялась. Но в остальном он интереснее и умнее
Ответить
3 дня
Уже обновилась, июль 24, он уже знает что Трамп дышит в пятки Байдену. Но все же у него призедент Байден
Ответить
2 дня
для моих задач хватает да же Моники. А дип Сик вообще пушка, больше чем надо. Главное чтоб бесплатно!
Ответить
8 часов
Все никак писюнами не намеряются.
Ответить