VLOGGER —— 自拍视频 AI
📸 VLOGGER 是谷歌的一个研究项目,它可以将一张人像照片转换成自拍视频,并辅以手势和对应的表情
🔩 这一技术包含两个核心能力,一是基于音频生成人物动作的 3D 运动扩散模型,二是可以增强文生图模型的扩散架构,它们让 VLOGGER 拥有了下述功能:
🔘 照片转视频:将一张真人照片转化为视频,类似阿里的 EMO,并且可以生成多种动作效果
🔘 翻译适配:将原视频的语言翻译成另一种语言,并根据新的语言调整人物的嘴唇和脸部动态,比如将英语译为西班牙语会增加嘴巴开合的频率以适应更快的语速
🔘 表情编辑:通过控制眼睛和嘴巴来改变原视频人物的表情,提供不同的表达情绪
🎉 目前 VLOGGER 还处于研究阶段(此处阅读论文),将来开放使用难免成为自媒体神器。如果视频放到 Parallel Live 上直播,还能有 AI 粉丝的应援!
频道:@RollerRolling
📸 VLOGGER 是谷歌的一个研究项目,它可以将一张人像照片转换成自拍视频,并辅以手势和对应的表情
🔩 这一技术包含两个核心能力,一是基于音频生成人物动作的 3D 运动扩散模型,二是可以增强文生图模型的扩散架构,它们让 VLOGGER 拥有了下述功能:
🔘 照片转视频:将一张真人照片转化为视频,类似阿里的 EMO,并且可以生成多种动作效果
🔘 翻译适配:将原视频的语言翻译成另一种语言,并根据新的语言调整人物的嘴唇和脸部动态,比如将英语译为西班牙语会增加嘴巴开合的频率以适应更快的语速
🔘 表情编辑:通过控制眼睛和嘴巴来改变原视频人物的表情,提供不同的表达情绪
🎉 目前 VLOGGER 还处于研究阶段(此处阅读论文),将来开放使用难免成为自媒体神器。如果视频放到 Parallel Live 上直播,还能有 AI 粉丝的应援!
频道:@RollerRolling
tgoop.com/rollerrolling/657
Create:
Last Update:
Last Update:
VLOGGER —— 自拍视频 AI
📸 VLOGGER 是谷歌的一个研究项目,它可以将一张人像照片转换成自拍视频,并辅以手势和对应的表情
🔩 这一技术包含两个核心能力,一是基于音频生成人物动作的 3D 运动扩散模型,二是可以增强文生图模型的扩散架构,它们让 VLOGGER 拥有了下述功能:
🔘 照片转视频:将一张真人照片转化为视频,类似阿里的 EMO,并且可以生成多种动作效果
🔘 翻译适配:将原视频的语言翻译成另一种语言,并根据新的语言调整人物的嘴唇和脸部动态,比如将英语译为西班牙语会增加嘴巴开合的频率以适应更快的语速
🔘 表情编辑:通过控制眼睛和嘴巴来改变原视频人物的表情,提供不同的表达情绪
🎉 目前 VLOGGER 还处于研究阶段(此处阅读论文),将来开放使用难免成为自媒体神器。如果视频放到 Parallel Live 上直播,还能有 AI 粉丝的应援!
频道:@RollerRolling
📸 VLOGGER 是谷歌的一个研究项目,它可以将一张人像照片转换成自拍视频,并辅以手势和对应的表情
🔩 这一技术包含两个核心能力,一是基于音频生成人物动作的 3D 运动扩散模型,二是可以增强文生图模型的扩散架构,它们让 VLOGGER 拥有了下述功能:
🔘 照片转视频:将一张真人照片转化为视频,类似阿里的 EMO,并且可以生成多种动作效果
🔘 翻译适配:将原视频的语言翻译成另一种语言,并根据新的语言调整人物的嘴唇和脸部动态,比如将英语译为西班牙语会增加嘴巴开合的频率以适应更快的语速
🔘 表情编辑:通过控制眼睛和嘴巴来改变原视频人物的表情,提供不同的表达情绪
🎉 目前 VLOGGER 还处于研究阶段(此处阅读论文),将来开放使用难免成为自媒体神器。如果视频放到 Parallel Live 上直播,还能有 AI 粉丝的应援!
频道:@RollerRolling
BY Roller | 科技产品分享
Share with your friend now:
tgoop.com/rollerrolling/657