这个名为Google Lumiere的模型,是一个大规模视频扩散模型,彻底改变了AI视频的游戏规则。
跟其他模型不同,Lumiere凭借最先进的时空U-Net架构,在一次一致的通道中生成整个视频。
具体来说,现有AI生成视频的模型,大多是在生成的简短视频的基础上对其进行时间采样而完成任务。
而谷歌推出的新模型Google Lumiere是通过联合空间和“时间”下采样(downsampling)来实现生成,这样能显著增加生成视频的长度和生成的质量。
论文地址:https://arxiv.org/abs/2401.12945
国内媒体介绍:谷歌爆肝7个月做出的AI视频生成器,彻底改变游戏规则?—新智元https://www.huxiu.com/article/2592137.html
相关导航
暂无评论...