1月24日讯,谷歌发布视频生成模型Lumiere,专门用于将文本转换为视频。Lumiere通过在空间和关键的时间维度进行上下采样,并利用预先训练好的文本到图像扩散模型,使得该模型能够直接生成全帧率、低分辨率的视频,并且在多个空间-时间尺度上进行处理。据介绍,该模型演示视频质量非常高,运动幅度和一致性表现也很好。(站长之家)