Новости Microsoft представила нейросеть VALL-E, которая может скопировать голос любого человека

Microsoft представила нейросеть VALL-E, которая может скопировать голос любого человека

Drako
Читать в полной версии

Компания Microsoft сообщила о создании нейросети под названием VALL-E, которая имитирует любой голос. Для этого ей нужно не более 3 секунд записи оригинального голоса. Нейросеть способна не только имитировать голос, но и даже дублировать эмоциональный фон.

Так работает нейросеть VALL-E

Система включает в себя нейронную языковую модель, в основе которой лежит EnCodec. Она разделает голос человека на компоненты и сопоставляет со своей базой данных. После этого нейросеть использует эти сведения для построения новых фраз.

Microsoft представила языковую модель на GitHub, но пока не публиковала исходный код. Ведь такой инструмент могут использовать мошенники.

😂 Илон Маск прошёлся по Assassin's Creed Shadows — Ubisoft прошлась по Маску в ответ
Комментарии 9
Оставить комментарий
Rintslerr Забанен
2 года

самое главное забыли упомянуть на каком языке должен говорить человек. Скорей всего пока только на английском, сомневаюсь что система поддерживает все языки мира, включая стрекочущий язык бушменов :))

Ответить
2 года

слышал, что только инглиш версия!

Ответить
2 года

А в prey'e пришлось бегать за несколькими аудио исходниками

Ответить
2 года

Такое уже было

Ответить
Pinkie Забанен
2 года

ну так попробовать то ее можно ?? или пока закр. тест у них ?

Ответить
2 года

Если бы можно было бы пробовать обычным смертным то получили б звонок "Добрый день, Пинки! Ваша пони сбила котёнка. Чтоб замять дело заплатите много деняк"

Ответить
Pinkie Забанен
2 года

лол, ну да, наверно ты прав. Мошенники и так названивают из "сбербанка", а как только получат такой новый инструмент — выйдут на новый уровень.

Ответить
2 года

наверное только текст тестовом режиме

Ответить
2 года

Я бы попробовал, но скорее всего ещё долго наш язык не поддерживать будет

Ответить