NVIDIA представила Fugatto — ИИ для генерации звука из текста

NVIDIA анонсировала новую экспериментальную модель генеративного ИИ под названием Fugatto (Foundational Generative Audio Transformer Opus 1), которая способна генерировать и модифицировать музыкальные, голосовые и звуковые файлы на основе текстовых запросов.

Модель разработана для работы с широким спектром задач, включая:

  • Создание музыкальных прототипов с возможностью менять стили, инструменты и голоса;
  • Генерацию голосов для языковых образовательных инструментов;
  • Адаптацию звуков для видеоигр в реальном времени в зависимости от действий игроков.

Fugatto также обладает уникальной способностью комбинировать команды, например, синтезировать речь с определёнными акцентами и интонациями или создавать звуки разного рода, которые при этом будут иметь динамику. Разработка модели велась при участии специалистов со всего мира, что позволило интегрировать в неё многоязычные и многоакцентные возможности.

На данный момент NVIDIA не раскрывает деталей о публичном доступе к Fugatto, оставив этот вопрос без комментариев.

🤯 Нейронку попросили заменить героиню Intergalactic на «более сексуальную», и вот что из этого вышло
+1
Комментарии 5