Psy Eyes

Hailuo: открыли для всех генерацию видео на основе картинки в I2V-01-Director Model с контролем камеры.

Можете заодно эти подсказки по управлению камерой опробовать.

Сайт
Твит

1.7K views15:30

Psy Eyes

0:52

This media is not supported in your browser

VIEW IN TELEGRAM

Luma: добавили генерацию аудио для созданных на их платформе видосов. Работает по нажатии кнопки Audio как без промта, так и с описанием.

Пока в бете режиме и бесплатно для всех пользователей.

PS: приминимо только к видео, сгенерированными в Ray 2.

Сайт
Твит

1.7K viewsedited 17:12

Красивое

Нужно такое с интро Настоящего детектива

Воркфлоу
https://civitai.com/models/1250209?modelVersionId=1409347

Дискорд

1.7K viewsedited 20:34

Psy Eyes

YuE: этот опенсорсный генератор музыки, оптимизировали для работы на 8 ГБ VRAM.

Ранее, к нему пришили возможность давать на вход аудио, чтобы обрабатывать демки по рефу.

Если YuE у вас установлен в Pinokio, то откройте его и обновите нажав Update в сайдбаре.

Pinokio
Гитхаб YuE
Гитхаб YuEGP

1.4K viewsedited 16:04

Psy Eyes

Тестим нейронку Сбера GigaChat для прокачки своих хард скилов

С её помощью легко починить код, освоить новый фреймворк или продвинутый концепт. В последней версии модели эти и другие задачи закрываются на ура. Сохраняйте рабочие промпты, которые можно отработать в Web-версии или Телеграм-боте прямо сейчас:

• Как интегрировать проект на Vue.js с внешними API?
• Составь план изучения баланса и настройки сложности в играх
• Напиши скрипт на Python, который скачивает изображения с сайта

1.5K views16:06

Psy Eyes

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

Братишка, я тебе пожрать принёс

1.3K views07:28

Psy Eyes

1:03

This media is not supported in your browser

VIEW IN TELEGRAM

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

Alibaba: выпустили опенсорсный видеогенератор Wan 2.1 в размерах от 1.3B до 14B.

Следование промту хорошее, в том числе и на динамичных сценах. Качество сильно скачет: где-то оно годное, чем ближе промт к датасету и выше разрешение, но зачастую всё плывёт и очень шумное, либо покрывается артефактами. Особенно, если разрешение ниже значений, на которые модель заточена.

Если сравнивать с недавними Skyreels и Stepfun, то они более детальную стабильную картинку выдают, но их и завезти ввиду размеров тоже не просто. В том же Хуньяне сгенерить искомое получалось значительно быстрее с более качественным изображением.

Есть поддержка мульти-GPU и улучшение промта с помощью Qwen (локально или и по API хаггинга). Как и Хуньянь модель может генерить и просто картинки. Но Wan ещё и умеет в английский/китайский текст на видео. Плюс у Wan нет цензуры и коммерческая лицензия, а значит притяжение сообщества будет.

Wan может генерить видео как по тексту, так и картинкам в разрешении от 480p до 720p. Позже говорят подъедет 1080p.

Text-2-video (T2V) моделей две: размером 1.3B и 14B. Вариант 1.3B потребляет 8 ГБ VRAM и 5 секундное видео в 480p на 4090 будет генерить 4 минуты. Правда выходные результаты для 2025 года будут смотреться так себе. Модель размером 14B уместится в 24 ГБ, если сделать разрешение в районе 400х400, но там и будет сильная потеря в качестве, либо 720p с длительностью около секунды, что займет ~10 мин на генерацию и шумы всё равно будут.

Image-2-video (I2V) модели тоже две, каждая на свой вариант разрешения: 480p или 720p. При этом обе только размером 14B. Для генерации видео в 720p на основе картинки нужно 70 — 80 ГБ VRAM и на A100 это займёт ~4,5 минуты. Либо опять же понижать выходное разрешение/длительность и получать артефакты.

Будем наблюдать за i2v оптимизациями комьюнити для работы по максимуму на одном GPU. Официальный воркфлоу от Comfy уже подъехал, как и сборка от Kijai.

Гайд по запуску в SwarmUI.

Демо
Хаггинг
Гитхаб
Comfy воркфлоу
Kijai

1.1K views09:40

Psy Eyes

Тем временем Хуньянь получает всё больше оптимизаций и в нём уже можно вместо 4 сек видео сгенерить 10 сек 720p на 4090. В настройки запихнули Sage Attention, Tea Cache, и другой фарш, чтобы оно могло запускаться и на менее производительном железе, если поиграться с настройками.

Гитхаб
Pinokio

1.1K viewsedited 09:46

Psy Eyes

This media is not supported in your browser

VIEW IN TELEGRAM

У меня сегодня День Рождения! Погладить можно в комментах.

В прошлом году собирали по 500+ руб на новый компьютер, и когда он появился, тем кто поблагодарил звонкой монетой я расшарил к нему доступ первыми.

В этом году тоже что-нибудь придумаем. Благо и мощности теперь есть, и нейронок годных море, и экосистема TON + телега развиваются.

На вискас:

RUB
https://www.tbank.ru/cf/9ffOB1eGiHd

TON

UQDKuW_brZHYtCGb9Yl17i38Y655BmNsVNK5RRZdJOdCMi0O

USDT (TON)

UQD0q1tjEdosBXB4zv4R3yvO9ly45IzNTa41z3mOXjco5E9s

BTC

1KvDmbCbbmMqyF5XXteJhFYmp5hAm35y92

Будут вопросы пишите в личку @AndreyBezryadin

Всех обнял.

1.2K views10:24

Psy Eyes

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Оставлю вам погонять MagicQuill

https://257bbc58121b.ngrok.app

1.2K viewsedited 10:34

Psy Eyes

0:49

This media is not supported in your browser

VIEW IN TELEGRAM

0:45

This media is not supported in your browser

VIEW IN TELEGRAM

Pika: обновили свой видеогенератор до V 2.2.

Что нового:
* 10 сек генерации
* 1080p видео
* Контроль кадра через кейфреймы

Сайт
Твит

1.6K views07:13

Psy Eyes

1:05

This media is not supported in your browser

VIEW IN TELEGRAM

Wonder Dynamics: представили Motion Prediction.

Это AI модель, которая предсказывает движения актёра в сцене там, где есть окклюзии, чтобы анимация не рвалась и продолжала выглядеть естественно.

Работает и там, где человек частично/полностью перекрыт объектом, и где он не полностью в кадре (например, при приближении к камере с общего плана на крупный).

Сайт
Твит

1.5K views07:43

Psy Eyes

1:31

This media is not supported in your browser

Flora: нодовый редактор, в котором есть возможность генерировать текст, картинки, и видео.

Можно улучшать промт, генерить сразу несколько вариаций одной кнопкой, совмещать выходы нод для комбинирования результатов, работать в команде, и не только.

Есть библиотека, из которой можно клонировать к себе любой публичный воркфлоу и переделать под свои нужды.

На халяву 2000 кредитов в месяц. На них дают погонять Flux Pro, Kling, Hailuo, Luma Photon + Dream Machine, Recraft V3, Pika, итд. Загрузка своих ассетов только на платных подписках от $16.

Сайт
Твит

1.8K views18:58

Psy Eyes

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

Runway: по-тихому выкатили фичу Restyle Video для смены стиля видео. Правда непонятно, чем это отличается от video-2-video функционала, доступного с сентября прошлого года. Видать потому без шума-гама и выпустили.

Твит

937 views18:59

2025/03/05 08:22:48

❌Photos not found?❌Click here to update cache.

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>