近日,米哈游创始人蔡浩宇新公司Anuttacon团队发布公告,公开其新一代视频角色表演生成模型 LPM 1.0。

据论文介绍,LPM 1.0是一个基于170亿参数扩散Transformer架构的视频模型,主打角色表演生成能力。与传统视频生成模型相比,该模型不仅关注画面生成,还尝试实现角色在视频中的连续表达,包括说话、倾听和实时反应,更注重于“表演”。

该模型可以根据输入图像生成具有稳定身份特征的视频角色,在对话过程中保持外观与行为一致,同时完成语音驱动、表情变化和动作反馈。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

项目标注的领导人包括曾爱玲(Ailing Zeng)。其个人主页显示目前就职于Anuttacon。据悉,曾爱玲此前在腾讯混元团队及AI Lab从事计算机视觉与生成模型相关研究工作。

负责人小红书有自己的账号:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片