目前的大多数AI电影生成系统依然难以触及“专业级”的门槛。它们往往无法理解和运用电影美学的核心原则,导致生成的视频画面模板化、镜头语言单调,故事节奏也缺乏张力,难以真正打动观众。为了解决这些痛点,香港大学推出了一款划时代的AI电影生成系统—FilMaster。这是一套端到端的自动化系统,融合了真实电影中的摄影语言与后期制作流程,目标是让AI真正学会“像电影人一样思考”,创作出符合行业标准、可编辑、富有情感张力的电影作品。

FilMaster 的核心架构围绕两个关键理念展开:其一是从 44 万部真实电影片段中学习专业摄影手法,其二是模拟面向观众的后期制作流程。整个流程分为两个阶段:第一阶段是“参考引导生成”,系统通过检索参考镜头,借助多镜头协同的 RAG 设计模块,引导AI生成富有表现力的视频片段;第二阶段是“生成式后期制作”,系统模拟真实剪辑流程,从粗剪到精剪,结合模拟观众反馈,优化镜头节奏与音效设计,提升视听感染力。(链接在文章底部)

01 技术原理

FilMaster 自动化电影生成框架概览:该系统以电影美学原则为指导,处理用户输入,生成可编辑、结构化的输出内容。其核心创新包括:(1)参考引导生成阶段中的多镜头协同 RAG 镜头语言设计模块

(2)利用真实电影数据,实现连贯且富有表现力的视觉呈现;

(3)生成式后期制作阶段中的以观众为中心的电影节奏控制模块,模拟专业的后期流程,以增强观众的沉浸感与情感共鸣。

02 效果演示

FilMaster 生成的视频示例:通过输入文字主题以及角色与场景的参考图像,FilMaster 能够创作出高质量的电影作品,具备专业的镜头语言和电影节奏。生成的视频内容丰富多层,包含完整的视听元素,如拟音(foley)、音效(SFX)、画外音(VO)、环境氛围声、配乐以及视频画面等。

“在他们的太空旅途中,金发的小王子和白色的狐狸遇到了一朵伤心的玫瑰。于是,小王子送给玫瑰一颗星星,而狐狸则模仿玫瑰摇头,逗它开心。”

长剧本处理复杂的叙事结构和长篇故事线。

迷你剧集根据一系列相关提示词生成多个连贯的剧集,展现其构建多集叙事的能力。“尼莫想玩捉迷藏,却一头撞进了一只章鱼的帽子里,结果被喷了一身墨水,变成了一条小黑鱼。(海洋,其他海洋生物)”

情感相关展示系统如何捕捉并传达特定情绪与氛围,体现其在情感表达方面的表现力。“他悄悄地听到门外传来了脚步声。(客厅,门外)”

尽管 FilMaster 在实现专业级自动化电影生成方面迈出了重要一步,但目前仍存在一些限制。例如,诸如调色和多样化电影转场等高级后期制作技术尚未被纳入系统中。这些元素对于打造完整且精致的电影视觉风格至关重要,但超出了FilMaster研究的主要范围—即聚焦于基础的镜头语言设计和电影节奏控制。

https://arxiv.org/pdf/2506.18899

欢迎交流~,带你学习AI,了解AI