Декабрь 27, 2022 Просмотры 52 просмотра

Riffusion генерирует музыку по тексту

Разработчики Сет Форсгрен и Хайк Мартирос создали нейросеть Riffusion, способную генерировать музыку на основе текстовых подсказок. Она умеет обучаться и накапливать информацию о музыке с помощью сонограмм – визуальной формы представления звуков. Подобный формат принципиально отличается от нотной записи и визуализирует произвольные звуки в любых сочетаниях.

Сонограмма является разновидностью графика, на котором по одной оси откладывается время исполнения каждого звука, а на другой его частота. Каждый пиксель обладает собственным цветом, обозначающим амплитуду звука в каждый момент времени. Сонограммы строятся с использованием модели цифрового обучения Stable Diffusion, поэтому их легко ассоциировать с текстом. Например, задать искусственному интеллекту придумать и озвучить «джаз с нотками летнего дождя».

Riffusion является своего рода экспериментом — благодаря специальному веб-приложению пользователи смогут генерировать произвольные мелодии и комбинации звуков. Весь процесс автоматически визуализируется, результат сохраняется в базе данных для дальнейшего обучения ИИ. Хотя большая часть произведений Riffusion звучит немного странно, это отличный пример довольно перспективной технологии манипуляции звуками в реальном времени.


Просмотры 52 просмотра

Статистика просмотров страницы:

  • за прошлый месяц (Октябрь 2025) - 2;
  • за последние 3 месяца (Август 2025 - Октябрь 2025) - 3;
  • за последний год (Ноябрь 2024 - Октябрь 2025) - 5;

Отзывы

Админ
Отлично!
Декабрь 27 Админ

Статьи и обзоры Все статьи

Подборка лучших бесплатных видеоуроков по программированию для детей и подростков.
Теперь пользователи получают максимум технологий без переплат, что делает апгрейд ...
В статье разбираем, от чего зависит скорость зарядки смартфонов и ...
Узнайте, какие квесты в Ташкенте заинтересуют профессионалов в области IT ...