Image to Music V2

Андрей Ракитин

ML-инженер и автор блога

Сфера: Музыка

Условия использования: Бесплатные

Задача:

Создать музыку

Доступ к API: Да

Попробовать

Image to Music V2 — нейросеть, которая пишет музыку по фото или картинке. Инструмент является бесплатным и размещен на площадке Hugging Face. Нейросеть генерирует небольшую мелодию, преобразуя картинку в текстовый промпт, который отправляется в одну из моделей для создания музыки. Для разработчиков доступен API.

Особенности Image to Music V2:

Создание музыки. Генерацией мелодии по текстовому описанию нынче никого не удивить. А создание музыки из картинки является весьма оригинальной задумкой. Идея проста: извлечь с помощью модели описание загруженного изображения, привести к промпту и отправить в одну из моделей для генерации мелодии. Вот эту задачу и решает Image to Music V2. Загрузите картинку или фото, и нейросеть сделает из неё музыку. Полученный результат можно экспортировать в формате .wav.
Выбор модели. Для создания музыки из фото с помощью нейросети вы можете выбрать одну из пяти моделей: MAGNet, AudioLDM-2, Riffusion, Mustango и MusicGen. Каждой нейросети нужно время на подключение к API, поэтому после выбора модели дождитесь появления фразы «api ready» в окошке справа.
Редактирование промпта. После создания музыки нейросетью вы также увидите текстовые инструкции, по которым модель сгенерировала мелодию. Вы можете отредактировать его и запустить процесс создания заново.

Image to Music V2 преобразует картинку в музыку бесплатно.

Похожие нейросети

MusicFX

MusicFX - нейросеть, генерирующая музыку. Приложение создаёт разнообразные мелодии высокого качества всего за несколько секунд. Перед генерацией музыку вы можете настроить длину трека, зацикливание и Seed. Также вас порадует удобная система промптинга. К сожалению, сервис доступен только для пользователей из США.

Mubert AI

Mubert AI - нейросеть, пишущая музыку. Приложение выделяется среди конкурентов возможностью создания композиций из изображений, использованием YouTube-видео в качестве исходника и интеграцией с Adobe Premier и After Effects. Помимо этого, нейросеть пишет музыку из текстового промпта, настроения, жанра или активности. Для разработчиков присутствует API.

OpenMusic

OpenMusic - бесплатная нейросеть для генерации музыки. ИИ создает уникальные мелодии длительностью до 10 секунд, отличающиеся высоким качеством звука. Такого результата разработчики добились с помощью подхода QA-MDT. Инструмент можно внедрить в свое приложение с помощью API.

Stable Audio

Stable Audio - нейросеть, создающая мелодию по текстовому описанию. Сервис обучен на огромном количестве аудиофайлов, что гарантирует высокое качество звука и релевантность результатов. Кроме того, предлагается возможность тонкой настройки параметров и удобная библиотека промптов для увеличения производительности.