Stable Diffusion Video

Андрей Ракитин

ML-инженер и автор блога

Сфера: Генерация видео

Условия использования: Бесплатные

Задача:

Создать видео

Доступ к API: Да

Попробовать

Stable Diffusion Video — нейросеть, создающая видео из изображения. Компания Stability AI держит планку и представляет модель, способную сгенерировать качественное видео с частотой кадров от 3 до 30 в секунду. Нейросеть будет совершенствоваться разработчиками, но пока что присутствуют некоторые проблемы и ограничения.

Stable Video Diffusion выпускается в виде двух моделей, способных генерировать 14 и 25 кадров с настраиваемой частотой кадров от 3 до 30 кадров в секунду. Оказалось, что эти нейросети превосходят PikaLabs и GEN-2!

Вы можете попробовать модель на HuggingFace или установить на компьютер из репозитория GitHub. Сейчас очень много желающих сгенерировать видео, поэтому сервис может выдавать ошибку из-за высокой нагрузки.

Вы можете присоединиться к списку ожидания, оставить заявку на сотрудничество и получение доступа к Fine-Tuning на этой странице. Учитывая количество заявок, не стоит ожидать быстрого ответа.

Ограничения Stable Diffusion Video:

Нейросеть создаёт видео длительностью не более 4 секунд.
Модель может генерировать видеоролики без движения или с очень медленным перемещением камеры.
Моделью нельзя управлять с помощью текста.
Модель не может отображать разборчивый текст.
Нейросеть пока что плохо справляется с людьми и лицами.

Похожие нейросети

Minimax AI

Minimax - генератор видео от китайских разработчиков, использующий AI-технологии для создания коротких роликов. Нейросеть создаёт реалистичные кадры, но длиной до 6 секунд. Модель немного отстаёт в детализации от флагманов данного направления, но в ближайшее время ожидается мощное обновление.

Luma AI

Luma AI Dream Machine - нейросеть для генерации видео. Сервис создаёт высококачественные и реалистичные ролики до 10 секунд из текста и изображений. ИИ генерирует последовательные кадры с учётом законов физики. Нейросеть Luma AI может оживить фото на основе первого и последнего кадров с учетом текстового описания.

Mochi 1

Mochi 1 - бесплатная нейросеть для создания видео. Модель учитывает законы физики и генерирует видеоролики с последовательными кадрами и реалистичными эмоциями в разрешении 480p. Нейросеть можно загрузить со страницы проекта в GitHub, но для запуска потребуется 4 графических процессора H100.

PixVerse AI

PixVerse AI - платформа для генерации видео на основе нейронных сетей. Поддерживается создание роликов из текста и изображений. PixVerse генерирует видео разрешением до 1080p и длительностью до 8 секунд. Доступны опции для добавления музыки и диалогов. Можно объединить до 7 кадров в одном видео, указав переход с помощью промпта.