DeepSeek выпустила Janus-Pro-7B, обогнавшую DALL-E 3 и Stable Diffusion в возможностях генерации изображений

Китайская компания DeepSeek представила новую мультимодальную нейросеть Janus-Pro-7B, предназначенную для эффективного распознавания и генерации изображений. В сравнении с предыдущими версиями, новая модель значительно улучшена: оптимизированы алгоритмы обучения, расширен датасет и увеличен размер самой модели. Эти изменения позволили нейросети значительно улучшить результаты в задачах, связанных с генерацией изображений по текстовым описаниям и их анализом.

Janus-Pro-7B продемонстрировала превосходство над известными моделями, такими как DALL-E 3 и Stable Diffusion, согласно тестам GenEval и DPG-Bench. Эта нейросеть обладает высокой детализированностью и реалистичностью в создании изображений, что делает её конкурентоспособной на фоне других решений. Модель уже доступна на платформе Hugging Face, а код можно бесплатно скачать с GitHub, что позволяет исследователям и разработчикам внести свой вклад в её развитие.

👍 Вышел второй трейлер фильма с Робертом Паттинсоном — «Микки 17»
+5
Комментарии 5