This media is not supported in your browser
VIEW IN TELEGRAM
Hailuo: открыли для всех генерацию видео на основе картинки в I2V-01-Director Model с контролем камеры.
Можете заодно эти подсказки по управлению камерой опробовать.
Сайт
Твит
Можете заодно эти подсказки по управлению камерой опробовать.
Сайт
Твит
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Красивое
Нужно такое с интро Настоящего детектива
Воркфлоу
https://civitai.com/models/1250209?modelVersionId=1409347
Дискорд
Нужно такое с интро Настоящего детектива
Воркфлоу
https://civitai.com/models/1250209?modelVersionId=1409347
Дискорд
YuE: этот опенсорсный генератор музыки, оптимизировали для работы на 8 ГБ VRAM.
Ранее, к нему пришили возможность давать на вход аудио, чтобы обрабатывать демки по рефу.
Если YuE у вас установлен в Pinokio, то откройте его и обновите нажав Update в сайдбаре.
Pinokio
Гитхаб YuE
Гитхаб YuEGP
Ранее, к нему пришили возможность давать на вход аудио, чтобы обрабатывать демки по рефу.
Если YuE у вас установлен в Pinokio, то откройте его и обновите нажав Update в сайдбаре.
Pinokio
Гитхаб YuE
Гитхаб YuEGP
Тестим нейронку Сбера GigaChat для прокачки своих хард скилов
С её помощью легко починить код, освоить новый фреймворк или продвинутый концепт. В последней версии модели эти и другие задачи закрываются на ура. Сохраняйте рабочие промпты, которые можно отработать в Web-версии или Телеграм-боте прямо сейчас:
•
•
•
С её помощью легко починить код, освоить новый фреймворк или продвинутый концепт. В последней версии модели эти и другие задачи закрываются на ура. Сохраняйте рабочие промпты, которые можно отработать в Web-версии или Телеграм-боте прямо сейчас:
•
Как интегрировать проект на Vue.js с внешними API?
•
Составь план изучения баланса и настройки сложности в играх
•
Напиши скрипт на Python, который скачивает изображения с сайта
This media is not supported in your browser
VIEW IN TELEGRAM
Братишка, я тебе пожрать принёс
Alibaba: выпустили опенсорсный видеогенератор Wan 2.1 в размерах от 1.3B до 14B.
Следование промту хорошее, в том числе и на динамичных сценах. Качество сильно скачет: где-то оно годное, чем ближе промт к датасету и выше разрешение, но зачастую всё плывёт и очень шумное, либо покрывается артефактами. Особенно, если разрешение ниже значений, на которые модель заточена.
Если сравнивать с недавними Skyreels и Stepfun, то они более детальную стабильную картинку выдают, но их и завезти ввиду размеров тоже не просто. В том же Хуньяне сгенерить искомое получалось значительно быстрее с более качественным изображением.
Есть поддержка мульти-GPU и улучшение промта с помощью Qwen (локально или и по API хаггинга). Как и Хуньянь модель может генерить и просто картинки. Но Wan ещё и умеет в английский/китайский текст на видео. Плюс у Wan нет цензуры и коммерческая лицензия, а значит притяжение сообщества будет.
Wan может генерить видео как по тексту, так и картинкам в разрешении от 480p до 720p. Позже говорят подъедет 1080p.
Text-2-video (T2V) моделей две: размером 1.3B и 14B. Вариант 1.3B потребляет 8 ГБ VRAM и 5 секундное видео в 480p на 4090 будет генерить 4 минуты. Правда выходные результаты для 2025 года будут смотреться так себе. Модель размером 14B уместится в 24 ГБ, если сделать разрешение в районе 400х400, но там и будет сильная потеря в качестве, либо 720p с длительностью около секунды, что займет ~10 мин на генерацию и шумы всё равно будут.
Image-2-video (I2V) модели тоже две, каждая на свой вариант разрешения: 480p или 720p. При этом обе только размером 14B. Для генерации видео в 720p на основе картинки нужно 70 — 80 ГБ VRAM и на A100 это займёт ~4,5 минуты. Либо опять же понижать выходное разрешение/длительность и получать артефакты.
Будем наблюдать за i2v оптимизациями комьюнити для работы по максимуму на одном GPU. Официальный воркфлоу от Comfy уже подъехал, как и сборка от Kijai.
Гайд по запуску в SwarmUI.
Демо
Хаггинг
Гитхаб
Comfy воркфлоу
Kijai
Следование промту хорошее, в том числе и на динамичных сценах. Качество сильно скачет: где-то оно годное, чем ближе промт к датасету и выше разрешение, но зачастую всё плывёт и очень шумное, либо покрывается артефактами. Особенно, если разрешение ниже значений, на которые модель заточена.
Если сравнивать с недавними Skyreels и Stepfun, то они более детальную стабильную картинку выдают, но их и завезти ввиду размеров тоже не просто. В том же Хуньяне сгенерить искомое получалось значительно быстрее с более качественным изображением.
Есть поддержка мульти-GPU и улучшение промта с помощью Qwen (локально или и по API хаггинга). Как и Хуньянь модель может генерить и просто картинки. Но Wan ещё и умеет в английский/китайский текст на видео. Плюс у Wan нет цензуры и коммерческая лицензия, а значит притяжение сообщества будет.
Wan может генерить видео как по тексту, так и картинкам в разрешении от 480p до 720p. Позже говорят подъедет 1080p.
Text-2-video (T2V) моделей две: размером 1.3B и 14B. Вариант 1.3B потребляет 8 ГБ VRAM и 5 секундное видео в 480p на 4090 будет генерить 4 минуты. Правда выходные результаты для 2025 года будут смотреться так себе. Модель размером 14B уместится в 24 ГБ, если сделать разрешение в районе 400х400, но там и будет сильная потеря в качестве, либо 720p с длительностью около секунды, что займет ~10 мин на генерацию и шумы всё равно будут.
Image-2-video (I2V) модели тоже две, каждая на свой вариант разрешения: 480p или 720p. При этом обе только размером 14B. Для генерации видео в 720p на основе картинки нужно 70 — 80 ГБ VRAM и на A100 это займёт ~4,5 минуты. Либо опять же понижать выходное разрешение/длительность и получать артефакты.
Будем наблюдать за i2v оптимизациями комьюнити для работы по максимуму на одном GPU. Официальный воркфлоу от Comfy уже подъехал, как и сборка от Kijai.
Гайд по запуску в SwarmUI.
Демо
Хаггинг
Гитхаб
Comfy воркфлоу
Kijai
This media is not supported in your browser
VIEW IN TELEGRAM
У меня сегодня День Рождения! Погладить можно в комментах.
В прошлом году собирали по 500+ руб на новый компьютер, и когда он появился, тем кто поблагодарил звонкой монетой я расшарил к нему доступ первыми.
В этом году тоже что-нибудь придумаем. Благо и мощности теперь есть, и нейронок годных море, и экосистема TON + телега развиваются.
На вискас:
RUB
https://www.tbank.ru/cf/9ffOB1eGiHd
TON
USDT (TON)
BTC
Будут вопросы пишите в личку @AndreyBezryadin
Всех обнял.
В прошлом году собирали по 500+ руб на новый компьютер, и когда он появился, тем кто поблагодарил звонкой монетой я расшарил к нему доступ первыми.
В этом году тоже что-нибудь придумаем. Благо и мощности теперь есть, и нейронок годных море, и экосистема TON + телега развиваются.
На вискас:
RUB
https://www.tbank.ru/cf/9ffOB1eGiHd
TON
UQDKuW_brZHYtCGb9Yl17i38Y655BmNsVNK5RRZdJOdCMi0O
USDT (TON)
UQD0q1tjEdosBXB4zv4R3yvO9ly45IzNTa41z3mOXjco5E9s
BTC
1KvDmbCbbmMqyF5XXteJhFYmp5hAm35y92
Будут вопросы пишите в личку @AndreyBezryadin
Всех обнял.
This media is not supported in your browser
VIEW IN TELEGRAM
Wonder Dynamics: представили Motion Prediction.
Это AI модель, которая предсказывает движения актёра в сцене там, где есть окклюзии, чтобы анимация не рвалась и продолжала выглядеть естественно.
Работает и там, где человек частично/полностью перекрыт объектом, и где он не полностью в кадре (например, при приближении к камере с общего плана на крупный).
Сайт
Твит
Это AI модель, которая предсказывает движения актёра в сцене там, где есть окклюзии, чтобы анимация не рвалась и продолжала выглядеть естественно.
Работает и там, где человек частично/полностью перекрыт объектом, и где он не полностью в кадре (например, при приближении к камере с общего плана на крупный).
Сайт
Твит
Flora: нодовый редактор, в котором есть возможность генерировать текст, картинки, и видео.
Можно улучшать промт, генерить сразу несколько вариаций одной кнопкой, совмещать выходы нод для комбинирования результатов, работать в команде, и не только.
Есть библиотека, из которой можно клонировать к себе любой публичный воркфлоу и переделать под свои нужды.
На халяву 2000 кредитов в месяц. На них дают погонять Flux Pro, Kling, Hailuo, Luma Photon + Dream Machine, Recraft V3, Pika, итд. Загрузка своих ассетов только на платных подписках от $16.
Сайт
Твит
Можно улучшать промт, генерить сразу несколько вариаций одной кнопкой, совмещать выходы нод для комбинирования результатов, работать в команде, и не только.
Есть библиотека, из которой можно клонировать к себе любой публичный воркфлоу и переделать под свои нужды.
На халяву 2000 кредитов в месяц. На них дают погонять Flux Pro, Kling, Hailuo, Luma Photon + Dream Machine, Recraft V3, Pika, итд. Загрузка своих ассетов только на платных подписках от $16.
Сайт
Твит
Runway: по-тихому выкатили фичу Restyle Video для смены стиля видео. Правда непонятно, чем это отличается от video-2-video функционала, доступного с сентября прошлого года. Видать потому без шума-гама и выпустили.
Твит
Твит