Новости Железо и технологии Создана новая нейросеть, которая генерирует музыку по текстовому описанию

Создана новая нейросеть, которая генерирует музыку по текстовому описанию

Drako

17 декабря 2022, 17:24

В сети появилась новая генеративная нейросеть под названием Riffusion. С её помощью можно создавать музыку из текста. Новинка основана на Stable Diffusion версии 1.5.

Идея состоит в том, что Stable Diffusion генерирует так называемые сонограммы или спектрограммы — визуальное представление музыки. Это обычная плоская картинка, где по на оси X показан порядок воспроизведения частот слева направо, а по оси Y — частота звука. Цвет пикселя же задаёт амплитуду звука в каждый момент времени.

Пример спектрограммы

Принцип работы прост: Stable Diffusion генерирует картинку и переводит её в спектрограмму, затем данные переводятся в звук с помощью библиотеки для обработки звука Torchaudio. В результате получается музыкальный трек. При этом в текстовом запросе можно указать жанр — рок, джаз и так далее. Даже можно сгенерировать звук набора на клавиатуре.

Попробовать самому новинку можно здесь.

😱 Обстановка в R.E.P.O. с недавним обновлением

Новости Железо и технологии нейросети ОС и программы

Комментарии13

Оставить комментарий

Sky_new

2 года

вот это уже интересно, но было бы круто если нейросеть научилась создавать фильмы, пускай даже они будут короткими из других нарезок киновселеной

Ответить

JoRaD

2 года

до этого ещё далеко, ну типо статическое изображение одиночное — без проблем можно, не считая пальцы и глаза, а чтобы эти изображения были взаимосвязаны друг с другом...типо один кадр продолжение предыдущего (например, персонаж повернул голову) пока нейронка такое совсем не может и , я думаю, что не скоро сможет

Ответить

Сергей Марченко

2 года

Попробывал , пока весьма сыро (качество)

Ответить

IBE

2 года

Ничего не понятно, но очень интересно.👍

Ответить

Rintslerr Забанен

2 года

сомневаюсь что это музыка. По сути музыку у нас на эстраде не видали да и на западе то не всегда её кто то слышал.
Ну разве что Те люди что попадали на концерт Металики, вот там да они слышали музыку

Ответить

✪ Progressive Psy

2 года

странные у вас размышления

Ответить

DeShadow_7077

2 года

Согласен, втирает какую-то дичь...
P.S. Против Metallica ничего не имею, но не только ж ее слушать...

Ответить

Aron Keni

2 года

все это странно, музыка есть музыка

Ответить

Комментарий скрыт

DeShadow_7077

2 года

Охренеть, нейросети прямо-таки прекрасный инструмент для создания аналогов искусства!

Ответить

Комментарий скрыт

DeShadow_7077

2 года

Круто, да) Но генерировать музыки для сна, наверное, не буду, для этого у меня 4.5К треков на телефоне)

Ответить

Комментарий скрыт

DeShadow_7077

2 года

Почти угадал, 50)

Ответить

Pinkie Забанен

2 года

а вот это уже интересно. скоро и музыканты без работы останутся.

Ответить

LiKYalP

2 года

А если написать какую-то отбитую до невозможности кринжатину он тоже сгенирирует

Ответить