DeepSeek выпустила Janus-Pro-7B, обогнавшую DALL-E 3 и Stable Diffusion в возможностях генерации изображений
Китайская компания DeepSeek представила новую мультимодальную нейросеть Janus-Pro-7B, предназначенную для эффективного распознавания и генерации изображений. В сравнении с предыдущими версиями, новая модель значительно улучшена: оптимизированы алгоритмы обучения, расширен датасет и увеличен размер самой модели. Эти изменения позволили нейросети значительно улучшить результаты в задачах, связанных с генерацией изображений по текстовым описаниям и их анализом.
Janus-Pro-7B продемонстрировала превосходство над известными моделями, такими как DALL-E 3 и Stable Diffusion, согласно тестам GenEval и DPG-Bench. Эта нейросеть обладает высокой детализированностью и реалистичностью в создании изображений, что делает её конкурентоспособной на фоне других решений. Модель уже доступна на платформе Hugging Face, а код можно бесплатно скачать с GitHub, что позволяет исследователям и разработчикам внести свой вклад в её развитие.
-
Представлена новая версия нейросети Kandinsky Video для создания видео
-
Исследователи протестировали нейросеть на Windows 98 — результат удивляет
-
Лучшие новые нейросети за осень-начало зимы 2024 года
-
Disco Elysium получила русскую озвучку — её создала нейросеть
-
Показан первый короткометражный фильм созданный нейросетью