CGEVENT Telegram 10722
Адобченко обещает заопенсорсить свою видео-модель.

Вышла довольно подробная статья про видео-модель от Адобе, она немного гиковатая, но там есть некоторое количество деталей, любопытных простым смертным.

Создание одного кадра требует от модели обработки всей последовательности, включая будущее. We address this limitation by adapting a pretrained bidirectional diffusion transformer to a causal transformer that generates frames on-the-fly (сорри, это не перевести, не сломав глаза). Чтобы еще больше сократить время ожидания, мы расширяем дистилляцию согласования распределения (DMD) на видео, сводя 50-шаговую модель диффузии к 4-шаговому генератору.

Такой подход эффективно позволяет синтезировать видео большой длительности, несмотря на обучение на коротких клипах. Наша модель поддерживает быструю потоковую генерацию видео высокого качества со скоростью 9.4 FPS(!!) на одном GPU благодаря KV-кэшированию. Наш подход также позволяет осуществлять потоковую трансляцию video-to-video, image-to-video, and dynamic prompting
.

В будущем мы выпустим код на основе модели с открытым исходным кодом.

Поглядите примеры на сайте - часть из них светилась в рекламе Firefly Video от Адобченко. Но в статье нет НИ слова про Firefly.

Очень симпатичные примеры image2video.

Неужели зарелизят код?

https://causvid.github.io/

@cgevent



tgoop.com/cgevent/10722
Create:
Last Update:

Адобченко обещает заопенсорсить свою видео-модель.

Вышла довольно подробная статья про видео-модель от Адобе, она немного гиковатая, но там есть некоторое количество деталей, любопытных простым смертным.

Создание одного кадра требует от модели обработки всей последовательности, включая будущее. We address this limitation by adapting a pretrained bidirectional diffusion transformer to a causal transformer that generates frames on-the-fly (сорри, это не перевести, не сломав глаза). Чтобы еще больше сократить время ожидания, мы расширяем дистилляцию согласования распределения (DMD) на видео, сводя 50-шаговую модель диффузии к 4-шаговому генератору.

Такой подход эффективно позволяет синтезировать видео большой длительности, несмотря на обучение на коротких клипах. Наша модель поддерживает быструю потоковую генерацию видео высокого качества со скоростью 9.4 FPS(!!) на одном GPU благодаря KV-кэшированию. Наш подход также позволяет осуществлять потоковую трансляцию video-to-video, image-to-video, and dynamic prompting
.

В будущем мы выпустим код на основе модели с открытым исходным кодом.

Поглядите примеры на сайте - часть из них светилась в рекламе Firefly Video от Адобченко. Но в статье нет НИ слова про Firefly.

Очень симпатичные примеры image2video.

Неужели зарелизят код?

https://causvid.github.io/

@cgevent

BY Метаверсище и ИИще


Share with your friend now:
tgoop.com/cgevent/10722

View MORE
Open in Telegram


Telegram News

Date: |

How to build a private or public channel on Telegram? Add up to 50 administrators Telegram has announced a number of measures aiming to tackle the spread of disinformation through its platform in Brazil. These features are part of an agreement between the platform and the country's authorities ahead of the elections in October. On June 7, Perekopsky met with Brazilian President Jair Bolsonaro, an avid user of the platform. According to the firm's VP, the main subject of the meeting was "freedom of expression." Those being doxxed include outgoing Chief Executive Carrie Lam Cheng Yuet-ngor, Chung and police assistant commissioner Joe Chan Tung, who heads police's cyber security and technology crime bureau.
from us


Telegram Метаверсище и ИИще
FROM American