看这部短片时,你可能不会怀疑自己看到的是AI短片,直到看到这个画面:

转圈的老式电话,拨号时手指怎么在这里呢?而且,片子的设定里,烧的纸器都已经是iPhone了,怎么还会有这么老式的电话机?

打开网易新闻 查看精彩图片

这是AI短片《纸手机》里最被讨论的一个画面——不是因为它有多好,而是因为它全然地暴露了,这部短片是生成的。尽管前面几分钟逼真得让人感受不出来。

但评论区没有人在骂。弹幕飘过的是「看到这里才发现是AI做的」,紧接着是「完全不在意」,「AI又怎么样,又不影响我哭」。

从AI可以完整生成视频诞生以来,没有一个AI影像作品可以逃开这个问题:有多逼真?模型迭代的速度被当作技术进步的刻度,每一次发布都伴随着「这次终于分不出来了」的惊叹或「还是一眼假」的嘲讽。尤其是真人题材,仿佛只要足够逼真,观众就会买单。

《纸手机》提供了一个反例。观众在明确知道这是AI生成的之后,仍然被打动,而且他们主动承认感动。那个电话bug不是被「原谅」了——它根本不在观众的评价维度里。他们在意的是另一件事:一个不懂死亡的小男孩,攒了15块钱,想给去世的奶奶烧一部手机。

这部全网播放量超4000万、被央视和人民日报转发的AI短片,由两个潮汕年轻人用三天做出来。导演李婷,98年生,做了五年产品经理后转型;搭档杨选,90后,广告导演出身,美术史背景。在可灵AI 3.0 Omni的帮助下,除了那部用纸壳板做的手机道具,画面中的一切——光线、人物、场景、表情——全部由模型生成。

当一部没有一秒钟是物理真实的短片,触发了真实的情感反应,「真」这个字意味着什么?

正逢清明,李婷和杨选都是潮汕人。烧纸钱、祭祖、给去世的亲人「寄东西」,是他们从小刻在身体里的习惯。杨选记得小时候跟家人上山,看到纸扎的煤气罐、房子、车子在火里卷曲变黑,「用纸做这些东西,恰恰体现了中国人情感的内敛和滞后,」他说。

「纸手机」这个概念就从这些记忆里生发出来。但让它成为一个故事的,是一系列叙事设计上的选择。

在故事的前段,面对只有15块钱的孩子,老板一开始画了个假手机打发他。直到得知,这个孩子已经是个孤儿,身边最后的亲人也去世了,他起身追出去。

找到孩子后,老板没有直接说「我来帮你」,而是说那部纸手机「信号不好」,给了他一部新的。

李婷说,这些笨拙的借口来自于她代入角色后的思考:「这个人在这个情境下,会怎么反应?」她想起自己小时候问长辈「什么是死亡」,对方愣了一下才回答。那个「愣了一下」的瞬间,被她放进了短片里——某个路人听到小男孩问话后的短暂停顿。

还有老板追出去前,把店铺的卷帘门放下一半。这代表着「暂时外出,很快回来」。

虽然是一部AI短片,但编剧环节是纯人工的。杨选在采访中反复强调:新手一定要自己写剧本,「来源于真实体验才能打动人」。

剧本确定后,进入AI生成阶段。他们使用的可灵3.0 Omni,主要依赖三个功能:多图参考(设定角色形象的一致性)、音画同出(同步生成画面与声音)、以及主体资产中的音色锁定(保证角色声音在全片中统一)。

工作流从人物设计开始。先设计形象,放入模型让它自由发挥对白,从中挑选最合适的音色,再锁定。

李婷说,这个过程中最容易被忽略的一步是「写提示词之前的思考」。「很多人觉得提示词要写得很长很复杂,但更重要的是精准度——你到底想要什么。」

精准度这个词在他们的工作流中反复出现。杨选为了理解不同视觉风格的底层逻辑,曾做过一个实验:用同一个模型生成10种完全不同的电影质感——日系、贾樟柯式、现代感。「不是在提示词里写「杨德昌风格」,」他说,「主要是分析那种风格为什么成立,日系的白柔效果从哪来?雪地这种材质怎么影响整个画面氛围?」

《纸手机》的胶片质感就是这种方法论的产物。有趣的是,他们在提示词中从未写过「颗粒感」或「胶片」这样的词。杨选说,那种质感是潜移默化、自然而然的。

「故事设定在那个年代,场景是午后暖光的纸器店、老式玻璃柜,这些东西放上去,质感自然就出来了。」他直言自己喜欢杨德昌、李安、侯孝贤那一代人的镜头语言和叙事方式,但并非刻意模仿,而是「你想这个故事的时候,自然会用那个时代的方式去想」。

最后的车内长镜头是全片最被称道的段落。一分多钟,小男孩坐在车上,窗外风景掠过,没有台词,只有背景音乐。李婷说,提示词主要描述的是窗外景色、小男孩的情绪递进、车内的颠簸感——以此模拟真实的坐车状态。

这个镜头一开始只有30秒。杨选看完后觉得可以再长,于是逐步延长。「亲人去世的时候,悲伤可能不是马上来的,」他说,「你可能周围的声音都没发现。耳鸣了一段时间,突然莫名的情绪一涌而上,像潮水一样。」

这个设计,不是数据分析出来的,也不是A/B测试的结果。是他们作为创作者个人记忆和情感驱动做出的选择。

两个人,三天,极限压缩可能不到三天。作为可灵平台的超级创作者,他们有算力支持,制作成本不高。但李婷特别强调了一句话:「AI降低了制作成本之后,人的价值反而更凸显了。成本里面更应该包括导演和编剧的创意策划——这些无形的东西呈现出来的价值,才是重点。」

采访中我问了一个带有假设性质的问题:如果这个故事用真人实拍,传递出来的情感会不同吗?

杨选很坦率:「实拍要做出来的话,非常吃力。小朋友演员能不能给到你要的东西?导演能不能调度到位?摄影呢?涉及太多层面了。」

李婷的回答更务实:「实拍更考验演员对故事的理解和演技,AI制作更考验导演。所有调度和设计都由导演把控。」她说,对她这种从来没有实拍经验的创作者,AI工具给了一种此前不存在的自由度。

这些回答听起来像是在替AI做辩护。但如果你把它们和另一组回答放在一起看,会发现一个更有趣的图景。

当我问到「网友说「最没人味的AI做出了最有人味的短片」,你们怎么看这个评价」的时候,杨选说了这么一段话:

「就像画画一样,颜料是死的,演员演的也是假的。但为什么能打动人?因为创作者是真诚的。我们信了自己的角色,信了自己的故事。做提示词的时候,潜移默化地,很多真实感的东西就给出来了。」

传统影视中,「真实感」的来源路径大致是:编剧写出可信的人物,演员用身体和情感去「活」这个人物,摄影和剪辑捕捉并放大那些不可复制的瞬间。

这条路径的核心假设是,需要经过一具真实的身体来中转。表演在叙事层面是「假的」(扮演角色),但表演的行为本身是真的:肌肉记忆、情绪调动、微表情、呼吸节奏,这些来自一个活着的身体。

AI影像取消了这个中转站。没有演员,没有「体验过」角色的身体,但《纸手机》依然让人觉得「真」。

一种可能的解释是:那些被认为来自演员身体的「真实感」,有很大一部分其实来自导演和编剧的观察力。李婷代入角色思考「他会有什么反应」时,她调用的是自己的童年记忆、对人的观察、对情绪节奏的直觉。

这些东西经由提示词传递给模型,模型生成了画面,画面触发了观众的共鸣。路径变了,但起点和终点没变:都是人的经验抵达人的情感。

这也解释了为什么两个人的搭配如此有效。杨选说,李婷负责「想象中的画面」,他负责「讲故事」。当不同的人带着不同的生活经历碰撞时,会产生他所说的「反情节」——那些不在剧本计划中、但因为足够真实而被保留。