Новости Microsoft представила нейросеть VALL-E, которая может скопировать голос любого человека

Microsoft представила нейросеть VALL-E, которая может скопировать голос любого человека

Drako
Читать в полной версии

Компания Microsoft сообщила о создании нейросети под названием VALL-E, которая имитирует любой голос. Для этого ей нужно не более 3 секунд записи оригинального голоса. Нейросеть способна не только имитировать голос, но и даже дублировать эмоциональный фон.

Так работает нейросеть VALL-E

Система включает в себя нейронную языковую модель, в основе которой лежит EnCodec. Она разделает голос человека на компоненты и сопоставляет со своей базой данных. После этого нейросеть использует эти сведения для построения новых фраз.

Microsoft представила языковую модель на GitHub, но пока не публиковала исходный код. Ведь такой инструмент могут использовать мошенники.

😉 Спокойно: S.T.A.L.K.E.R. 2 не запретят в России
Комментарии 9
Оставить комментарий
1 год

самое главное забыли упомянуть на каком языке должен говорить человек. Скорей всего пока только на английском, сомневаюсь что система поддерживает все языки мира, включая стрекочущий язык бушменов :))

Ответить
1 год

слышал, что только инглиш версия!

Ответить
1 год

А в prey'e пришлось бегать за несколькими аудио исходниками

Ответить
1 год

Такое уже было

Ответить
Pinkie Забанен
1 год

ну так попробовать то ее можно ?? или пока закр. тест у них ?

Ответить
1 год

Если бы можно было бы пробовать обычным смертным то получили б звонок "Добрый день, Пинки! Ваша пони сбила котёнка. Чтоб замять дело заплатите много деняк"

Ответить
Pinkie Забанен
1 год

лол, ну да, наверно ты прав. Мошенники и так названивают из "сбербанка", а как только получат такой новый инструмент — выйдут на новый уровень.

Ответить
1 год

наверное только текст тестовом режиме

Ответить
1 год

Я бы попробовал, но скорее всего ещё долго наш язык не поддерживать будет

Ответить