Mochi 1 — бесплатная нейросеть для создания видео. Модель генерирует видеоролики с последовательными кадрами и реалистичными эмоциями в разрешении 480p. Нейросеть можно загрузить со страницы проекта в GitHub, но для запуска потребуется 4 графических процессора H100.
Особенности Mochi 1:
- Создание видео. По данным на 27 октября 2024 года Mochi 1 — единственная нейросеть для генерации видео с открытым исходным кодом. Предварительная версия модели поддерживает разрешение 480p и соблюдает законы физики при моделировании взаимодействия объектов. До конца года будет представлена полная версия Mochi 1, поддерживающее создание видео в формате 720p с повышенной точностью и более плавным движением.
- Характеристики. Mochi 1 представляет собой модели диффузии с 10 млрд параметров на основе архитектуры Asymmetric Diffusion Transformer. AsymmDiT эффективно обрабатывает пользовательские запросы и сжатые видео-токены, упрощая обработку текста и акцентируя мощности нейросети на визуальные рассуждения.
- Системные требования. Загрузить веса модели можно на странице проекта. Там же вы найдете инструкцию по использованию с помощью командной строки и Gradio UI. Для запуска нейросети локально или на сервере потребуется 4 графических процессора H100.
На официальном сайте нейросеть создает бесплатно 4 видео в 6 часов, но при загрузке присутствует водяной знак.