Stability AI представила компактную ИИ-модель для генерации звука без интернета

Компания Stability AI, известная своими разработками в области генеративного ИИ, анонсировала новую модель для создания аудио — Stable Audio Open Small. Главная особенность инструмента — возможность работы на смартфонах без подключения к интернету, благодаря оптимизации для процессоров Arm.

Модель, разработанная совместно с производителем чипов Arm, ориентирована на создание коротких звуковых фрагментов: семплов, эффектов или инструментальных зарисовок длиной до 11 секунд. По заявлению разработчиков, генерация такого аудио занимает менее восьми секунд даже на мобильных устройствах. Это стало возможным за счёт уменьшения размера нейросети до 341 миллиона параметров и адаптации под энергоэффективные чипы.

В отличие от облачных сервисов вроде Suno и Udio, Stable Audio Open Small функционирует локально, что решает проблему задержек и зависимости от интернета. Кроме того, обучение модели проводилось исключительно на данных из бесплатных библиотек Free Music Archive и Freesound, что минимизирует риски, связанные с авторскими правами. Это отличает её от некоторых конкурентов, использующих спорный контент для тренировки ИИ.

Однако у инструмента есть ограничения: он поддерживает только английские текстовые запросы, не генерирует вокал или сложные композиции. Условия использования также варьируются: для стартапов и исследователей модель бесплатна, но компании с годовым доходом выше $1 млн должны приобретать коммерческую лицензию. Stable Audio Open Small не претендует на замену профессиональных студий, но предлагает удобное решение для быстрого создания звукового сопровождения непосредственно на мобильных устройствах.

🛡 У пиратов траур — Mafia: The Old Country получит защиту Denuvo
-1
Комментарии 2