Ну что, появился новый конкурент Sora
Речь о китайской Kling, создающей видео-ролики продолжительностью до 2 минут. Она неплохо справляется с моделированием пространств, движений и физических законов (конечно, пока не на ‘отлично’, но все лучше, чем некоторые видео от гугловской Veo).
Напомню, что такие генеративные модели нужны не только для того, чтобы отнимать работу у режиссеров и видео-креаторов, но и для обучения ИИ-агентов.
(Кстати, наконец нашла удобоваримый термин, который заменяет более тяжеловесный «универсально-воплощенный агент»: foundation agents. Это как foundation model, только речь уже не о языковых моделях, а об агентах, обученных на мультимодальных датасетах, способных действовать как в физических, так и в виртуальных средах, а также автономно принимать решения. Подробнее - в этой статье).
Так вот, если реальных интерактивных данных недостаточно или их получение невозможно, для обучения «фундаментальных агентов» можно использовать симуляторы и генеративные модели, такие как Sora, Veo или Kling.
Так что чем больше конкурентоспособных моделей, генерирующих консистентные видео, тем больше потенциальных данных для будущих агентов.
И тем больше шансы, что OpenAI в конце-концов откроет доступ к Sora.
#technologies
Речь о китайской Kling, создающей видео-ролики продолжительностью до 2 минут. Она неплохо справляется с моделированием пространств, движений и физических законов (конечно, пока не на ‘отлично’, но все лучше, чем некоторые видео от гугловской Veo).
Напомню, что такие генеративные модели нужны не только для того, чтобы отнимать работу у режиссеров и видео-креаторов, но и для обучения ИИ-агентов.
(Кстати, наконец нашла удобоваримый термин, который заменяет более тяжеловесный «универсально-воплощенный агент»: foundation agents. Это как foundation model, только речь уже не о языковых моделях, а об агентах, обученных на мультимодальных датасетах, способных действовать как в физических, так и в виртуальных средах, а также автономно принимать решения. Подробнее - в этой статье).
Так вот, если реальных интерактивных данных недостаточно или их получение невозможно, для обучения «фундаментальных агентов» можно использовать симуляторы и генеративные модели, такие как Sora, Veo или Kling.
Так что чем больше конкурентоспособных моделей, генерирующих консистентные видео, тем больше потенциальных данных для будущих агентов.
#technologies
tgoop.com/extended_surreality/325
Create:
Last Update:
Last Update:
Ну что, появился новый конкурент Sora
Речь о китайской Kling, создающей видео-ролики продолжительностью до 2 минут. Она неплохо справляется с моделированием пространств, движений и физических законов (конечно, пока не на ‘отлично’, но все лучше, чем некоторые видео от гугловской Veo).
Напомню, что такие генеративные модели нужны не только для того, чтобы отнимать работу у режиссеров и видео-креаторов, но и для обучения ИИ-агентов.
(Кстати, наконец нашла удобоваримый термин, который заменяет более тяжеловесный «универсально-воплощенный агент»: foundation agents. Это как foundation model, только речь уже не о языковых моделях, а об агентах, обученных на мультимодальных датасетах, способных действовать как в физических, так и в виртуальных средах, а также автономно принимать решения. Подробнее - в этой статье).
Так вот, если реальных интерактивных данных недостаточно или их получение невозможно, для обучения «фундаментальных агентов» можно использовать симуляторы и генеративные модели, такие как Sora, Veo или Kling.
Так что чем больше конкурентоспособных моделей, генерирующих консистентные видео, тем больше потенциальных данных для будущих агентов.
И тем больше шансы, что OpenAI в конце-концов откроет доступ к Sora.
#technologies
Речь о китайской Kling, создающей видео-ролики продолжительностью до 2 минут. Она неплохо справляется с моделированием пространств, движений и физических законов (конечно, пока не на ‘отлично’, но все лучше, чем некоторые видео от гугловской Veo).
Напомню, что такие генеративные модели нужны не только для того, чтобы отнимать работу у режиссеров и видео-креаторов, но и для обучения ИИ-агентов.
(Кстати, наконец нашла удобоваримый термин, который заменяет более тяжеловесный «универсально-воплощенный агент»: foundation agents. Это как foundation model, только речь уже не о языковых моделях, а об агентах, обученных на мультимодальных датасетах, способных действовать как в физических, так и в виртуальных средах, а также автономно принимать решения. Подробнее - в этой статье).
Так вот, если реальных интерактивных данных недостаточно или их получение невозможно, для обучения «фундаментальных агентов» можно использовать симуляторы и генеративные модели, такие как Sora, Veo или Kling.
Так что чем больше конкурентоспособных моделей, генерирующих консистентные видео, тем больше потенциальных данных для будущих агентов.
#technologies
BY EXTENDED (SUR)REALITY
Share with your friend now:
tgoop.com/extended_surreality/325