打开网易新闻 查看精彩图片

全文约 7465 字

预计阅读 19 分钟

AI 正在变得越来越强,未来,人和 AI 会是什么样的关系?

在极客公园 IF 2026 创新大会上,我和字节跳动即梦Dreamina 张楠讨论了人与 AI 、AI 与创作、Sora 与抖音、AI 时代的组织形态等内容。

在对谈正式开始之前,我们放映了一个 18 分钟的 AI 短片——即梦 AI 青年导演合作计划之一《老妈的心愿》。这是导演小文关于自己妈妈的故事。过去,她是一个编剧,借助即梦 AI,她和搭档晓丹做起了导演,将脑海中的故事变成了画面和故事都「不掉帧」的影像——在即梦 AI 这样的 AI 工具出现之前,这很难想象。

打开网易新闻 查看精彩图片

《老妈的心愿》截图|图片来源:极客公园

以下与张楠在极客公园IF2026 创新大会上的对话实录,由极客公园团队整理

张鹏:欢迎张楠再次来到我们极客公园创新大会!刚才这部 18 分钟的短片,你看完是什么感受?

张楠:大家好,首先感谢极客公园的邀请。我不知道现场大家这么有耐心,看完这个 18 分钟的片子,有什么感受?我当时看完了内心特别感动。这是小文的真实故事,包括她用即梦 AI,做姥姥姥爷的照片,都是真实的故事。这个真实的故事非常打动我,我在看的时候非常投入,甚至感动流泪。当时张鹏坐在我边上,我有偷偷用眼睛瞄你,看到你好像在偷偷擦眼角,确实很打动人,让我完全忘掉了它到底是用什么样的技术创作的影片。

打开网易新闻 查看精彩图片

张楠在极客公园创新大会 2026 上对话张鹏|图片来源:极客公园

张鹏:这部片子最难得的,其实不是画面流畅、「人物一致性」问题解决得很好,而是「故事不掉帧」,情节本身足够连贯,能让人完全沉浸其中。尤其是结尾和真实人物的交集部分,真的让人觉得震撼又感动。我还是想确认:这部片子全程都是 AI 完成的吗?我很好奇具体的创作过程是怎样的?

张楠:首先我替小文证明一下,因为我完整参与了青年导演合作计划,它是一个为期三个月的项目,邀请了七个导演,风格特别不一样,他们真实地跟我们一起工作了三个月,每周都开会。

张鹏:不只是来投个稿。

张楠:不是,我们几乎每周都会开会,甚至一起线下开会,每个双周,我们会讨论哪些事情在技术上应该做改进,他们想做的这些故事,想要完成什么样的效果,我们应该怎么配合,这是一个深度共创的过程。

小文的这部片子,从头到尾,从生图到生视频,全部都是由 AI 来创作的。整体有差不多 400 多个分镜,生成上万张图,做了几千条视频。我觉得小文太有毅力了,这是非常了不起的一个实验。

张鹏:即梦今年为什么要发起青年导演合作计划?核心目标是什么?毕竟对一家成熟公司来说,任何项目的启动,肯定都有明确的考量。

张楠:其实这个计划从一年多前开始构思即梦这个项目时,它就发生了。主要源于我对创作者的创作力、想象力是如何发生的好奇心。我特别想近距离的去观察,这个世界上这么有创意的人,他们每天在想什么,思考什么,那些灵感怎么突然出现在他们脑子里。

青年导演合作计划,是我们与创作者合作的第三期项目。第一期是跟普通的 AI 创作者,他们是最先尝试 AI 技术的。第二期找了这些 AI 创作者里,特别会讲故事的。第三期,我们邀请了一批真正意义上的导演,他们很多都曾经斩获釜山国际电影节、FIRST 电影节短片大奖,出身传统影视体系,也是对 AI 技术很感兴趣的一群人。

01 从想驾驭 AI,到跟 AI 共创

张鹏:当创作者把 AI 作为创作的唯一工具时,在实际创作中会遇到哪些核心问题?

张楠:创作过程其实非常周折,我们也确实遇到了很多挑战。大家都很想用技术去完美还原脑海中的画面、讲述心中的故事,但技术在当下的确存在局限。

让我印象深刻的是,参与者中既有 AI 老手,也有完全的新手,能明显感受到两类人的预期截然不同。

用过 AI 的人相对保守,因为了解现阶段技术的局限和底层逻辑,他们更懂得妥协;而没用过的人则倾向于完美主义,起初极度想要掌控 AI,试图精准还原每一个表达瞬间。

但有趣的是,随着过程推进,他们逐渐发现可以跟 AI「做游戏」、「做实验」,心态发生了奇妙的转变。

这其中,胤超导演作为一位审美极佳的导演,在制作写实风格短片时,突然捕捉到了一个瞬间,让他领悟到了 AI 的乐趣。

他曾经分享过一位摄影指导朋友的故事:这位朋友热衷实拍,有天晨跑时路过一座小桥,光影绝佳。出于职业本能,他举起手机准备记录。就在按下快门的刹那,一只白鹭伴着晨光意外闯入画面。那一刻,他觉得大自然的馈赠让他捕捉到了不可复制的绝美镜头。

胤超感慨,用 AI 创作也有同样的感受:从最初试图「驾驭」,演变为后来的「共创」

AI 也会赋予你那种神奇的时刻——它生成的结果可能完全超乎想象,却又与你的内核莫名契合,让你惊叹「哇,还可以这样」。这种由技术带来的动人瞬间与心态转变,给我留下了很深刻的印象。

02 AI 是人能力的放大器

张鹏:结合你一直以来对 AI 与人关系的思考,你现在有明确的答案了吗?随着 AI 能力越来越强,未来人和 AI 到底会形成怎样的关系?是不是就像你说的,不是去控制它,而是把它当成伙伴?

张楠:对,就拿即梦来说,首先它肯定是一个工具产品,我们一开始定位它就是工具。

因为一切都要从基础做起:先做一个能切实服务创作者的工具,帮他们把脑海中的故事更好地实现出来,这是根本。

跟传统工具截然不同的是,AI 工具自带「智能」。面对一个有智能的工具,人类应该如何跟它协作?

关于人与 AI 的关系,我想引用乔布斯那个著名的比喻——「电脑是大脑的自行车」。这源于一份关于生物移动效率的测试:单纯靠双腿,人类的能耗效率显著落后于秃鹰;但如果给人类一辆自行车,人类就能轻松胜出。

在今天,AI 更像人类能力的放大器。它不应该单纯是一个工具,而是应该能够把创作者带往此前未有涉足的领域,帮他们实现连自己都未曾想象的创作。我希望在未来,人与 AI 的关系是共同协作:AI 激发人,人再借助 AI 走得更远。

张鹏:那是不是意味着,未来优质影视内容的创作会变得更加平权?就像你说的,AI 是能力放大器,只要创作者有自己的审美和世界观,就能借助 AI 摆脱现实世界和行业传统的资源束缚,让自己的想法更快地发光?

张楠:特别对,你提到平权这个词,也是当时创作者们提到最高频的词。

小文原来是编剧,在传统影视行业里,编剧往往不像导演那样拥有对现场的指挥权和掌控力。

蓝天导演曾跟我们感慨,AI 确实赋予了普通人表达的权力——像小文这样,只要脑海里有故事、有细腻的情感,对生活有观察和积累,即便没有资源,也完全可以用 AI 进行创作。

传统影视制作的门槛其实非常高,哪怕只是制作一支像样的短片,其复杂程度也远超简单的 UGC 短视频拍摄。

蓝天导演甚至用了一个很有趣的词叫「街头智慧」:在传统的片场,要调度导演、制片、摄影、置景以及一大堆演员,没有点「街头智慧」根本玩不转。

可见,过去想要通过影像讲述一个完整的故事,是多么复杂的一件事。

03 Sora 不是 AI 版的抖音

张鹏:年 Soraapp引发了全球关注,很多人说它是 一个「AI 版抖音」。抖音是你一手带起来的,你最了解整个过程,怎么看待这个说法?你对 Sora 本身有什么评价?

张楠:这个问题问得很好。首先说回抖音,这是我最熟悉的产品,我认为它的本质还是「人」。

抖音源于真实生活——无论是有趣还是平凡,生活中那些不期而遇的意外和瞬间,都是天然的创作素材。只要人活着,生活每天 24 小时都在继续,你只需将其记录下来就好。

所以我不认为 Sora 是「AI 版的抖音」。

Sora 其实是在用「想象力」进行创作和社交,就像是用想象力跟朋友们一起玩。但挑战在于,想象力很容易枯竭,人很容易想着想着就没灵感了,这不像真实生活那样源源不断。所以,这类产品还需要通过大量的产品设计,来解决如何让用户保持长期活跃的问题。

张鹏:所以你非常明确,不认同「Sora 是 AI 版抖音」」这个观点?

张楠:抖音是记录美好生活,Sora 没有在记录。

张鹏:Soraapp的出现,有没有哪些亮点让你觉得值得肯定?会不会让你产生「这件事我们也应该做」的想法?它问世之后,对即梦团队带来了哪些影响?

张楠:首先,我认为 Sora 的出现是一件好事,它让大家看到了更多的可能性。给我感触最深的是,他们能够将模型的迭代与真实的应用场景紧密结合,以此来推动协作与工作,这一点是非常好的。

张鹏:你是说 Sora 的模型本身就与产品形态预先做了对齐。

张楠:是的,因为也是一个团队,同时大家在迭代这个技术的过程中,也在充分思考这个技术在真实的产品应用场景里面,它应该是什么样的效果。大家应该怎么去玩、互动,这个地方他们考虑的挺充分的。

04 拥抱不确定性

张鹏:刚才聊到人与 AI 的关系,我很好奇:即梦和 Sora 这类产品,出发点是不是从根源上就不同?即便 Sora 的技术表现很惊艳,也没有让你觉得特别意外吗?虽然 Sora 的技术很炸裂,可能并未让你有太多的波澜?

张楠:首先技术确实很好,但我相信这个技术不难,大家假以时日肯定都能做到,技术不是这件事情里面最重要的。

张鹏:必要不充分。

张楠:也可以这样讲,我更关心或者我们更想做的事是怎么利用技术去更好地思考这个技术以后怎么去服务人,服务什么样的人。在服务过程中你怎么去找到一个正确的目标函数,这是我们特别关心的。

张鹏:你提到了「目标函数」,你也经历了从抖音到即梦,对应的目标函数,发生了哪些变化?

张楠:我个人人生非常重要的目标或者能带来意义感的东西,肯定是有更多的体验。作为一个好奇心很强的人,我很关注我人生当中的体验是不是足够丰富。

即梦的探索方向是试图结合 AI 技术,去解锁全新的场景与产品形态。

在立项之初,我们就确立了目标——希望借助 AI 技术帮助人类提升创造力,甚至去激发人类创造力的上限。

在这个过程中,我也感受到了很强的不确定性。因为技术一直在高速发展、尚未收敛,产品的形态也在不断演变,我们需要时刻思考产品、技术与人之间的关系。比如在人机协作中,究竟何时该由人主导,何时该由 AI 辅助?这些一直在变化。

张鹏:你似乎很享受这种不确定性?

张楠:喜欢体验的人都不喜欢一成不变,我非常拥抱不确定性。

张鹏:在这种不确定性中,有没有一些已经显现的确定性?比如在解放人类创造力这件事上,这两年你有没有看到一些逐渐清晰的方向?可能通向哪儿?

张楠:首先技术不停的发展,技术越来越变好,肯定是很确定的,成本的降低肯定是很确定的。人和 AI 的关系,创作者越来越利用 AI 来完成创作,肯定是非常确定的。这些确定,使我和我团队比较坚信这件事情是非常正确的方向。我自己在这个过程当中,也确实看到一些在产品设计上、技术上能明确带来对创作者的帮助,每个阶段的小踏步,这些确定性都很真实。

张鹏:我们换个角度看。今天大家使用 AI 的方式很多元,核心取决于目标:一种是把 AI 当成生产力工具,追求效率最大化,只要量足够大、成本足够低,也许就能满足某些任务的目标;另一种是借助 AI 探索内容形态的边界,表达自我。你觉得 AI 对人类的影响,更偏向工业化的生产力提升,还是会引领一场新的文艺复兴?它究竟是解放了人,还是强化了工业化生产逻辑?

张楠:这是一个很大的话题,核心取决于具体的应用场景。对于某些场景,确实可以实现端到端的自动化,人只需要在最后环节进行检查或纠偏即可。但在「创作」或「表达」这类场景中,我无比坚信人类必须深度参与。因为表达的本质,是你、是我、是每一位创作者发自内心的诉求——只有我们自己最清楚想要表达什么。

在这个过程中,AI 更像是一个「全能团队」,它协助你完成表达,填补你过去因资源匮乏、支持不足或能力受限而留下的空白。但归根结底,表达的源动力一定来自于人本身。

张鹏:想表达是人的本能,但把想法变成实实在在的作品,向世界传递,这个过程的门槛很高,很多时候摩擦力也很大。就像现在很多人连朋友圈都不发了,连简单的表达都在退缩。我们该如何消除这种表达的摩擦力?

张楠:表达是人类与生俱来的本能。我非常理解你所说的「摩擦力」,这往往源于过往资源的受限,或是创作者对自己表现不够好的担忧。但相比于消除摩擦力,我更关注的是创作的动力:用户在这个过程中能否感受到自己的成长?表达内容的品质是否在不断提升?这种「获得感」才最关键。

这就涉及到产品设计的核心目标函数,有些 AI 产品专注于生产效率,旨在通过自动化替代繁琐的美工工作。但在即梦,我们在设计时,不仅仅关注任务完成得顺不顺、快不快。我们不需要一味地迎合或谄媚,而是要在过程中不断激发创作者。

这里需要一个微妙的平衡:AI 既要作为帮手,处理掉那些你原本不愿做的琐碎工作,同时又要作为伙伴去激发你、质疑你——「这样做是不是还不够好?」迫使你进行更深度的思考,花更多时间去打磨作品,这其实是很难做到的。

张鹏:能不能结合即梦的产品设计举些例子?比如什么样的功能设置,能实现你说的「让用户深度参与」以及「不谄媚用户」?

张楠:举个例子,以前的生图或生视频往往是单向的:你给一个 Prompt,它吐出一个结果。但现在的工作流正转变为以 Agent(智能体)为核心的协作模式。在这个过程中,你需要与 AI 进行大量的沟通、讨论甚至争辩。即便 Agent 能自动调用工具,我们依然要在流程中,给创作者预留出足够的参与空间、决策权和引导能力,让它变成真正的「深度共创」。

张鹏:反过来,AI 会觉得用户给它的 promt 不够好吗?就像,我觉得那些能提出不同意见的人往往能给我更大帮助你觉得 AI 需要具备这种「质疑和优化」的能力吗?

张楠:肯定需要。

过去我们追求效率,总想着把一小时的活压缩到半小时。但如果我们想提升创造力和内容质量,时长缩短并不是唯一的关键指标。

相反,创作时间变长未必是坏事。关键在于这多出来的时间里发生了什么——你们进行了多少轮对话?对话质量如何?AI 给出的建议你是否采纳?这中间有没有发生过激烈的思维碰撞?这些高质量的互动过程不仅对作品至关重要,对我们后续的模型训练也极具价值。

张鹏:听起来如果要让 AI 成为真正的伙伴,「取悦型人格」显然不行,更需要的是平等对话、思维共振的关系。这其实已经超出了纯技术的视角。

张楠:对,取决于什么样的场景解决什么样的问题。

05 AI 时代的组织形态

张鹏:聊完产品和技术,我们谈谈组织形态。在 AI 时代,我们现在很多年轻创业团队就几个人,却能做看似体量很大的事,团队规模比移动互联网时代小了很多。我很好奇,即梦现在的内部组织架构是怎样的?团队是如何协作的?和上一个时代的组织模式相比,有哪些变化?

张楠:首先现在我们的工作方式非常像创业团队,字节也一直都有很重要的价值观,「始终创业」。

外界通常认为字节以强大的「中台」著称,但在一些创新业务线,我们打破了传统的组织界限。以即梦为例,里面有很多探索型项目,团队非常精干,从产品、技术到设计可能一共只有 10 个人。大家坐在一起,工作节奏非常紧凑灵活。

张鹏:团队的具体构成是怎样的?比如算法、产品、设计这些角色,是不是都集中在一个团队里?

张楠:对。

张鹏:是一个浓缩在一起的综合型团队。

张楠:对,其实很像一个小的创业组织,五脏俱全,但非常小而精。通俗的说法是,以前很多沟通要靠飞书,现在的沟通就靠吼,因为都坐在一起。

张鹏:今年我听很多人说,在 AI 创新领域,「反中台」是一种趋势——需要把各类能力整合到一个团队,变成一体循环。你有没有感受到这种变化?

张楠:这个和业务成熟度相关,我们有很多成熟的业务还是需要流程化、标准化的工作,保证线上众多用户的服务质量。

探索型的项目早期,我们实行的是「探索产品 Demo 制」。这里没有严格的项目评审,几个人今晚有想法,做出来,明早直接看 Demo,是一个快速滚动迭代的过程。

06 创造,是比创业更底层的驱动力

张鹏:在 AI 浪潮下,创作门槛大幅降低,很多年轻人甚至 00 后,都能借助 AI 实现自己的想法。现在年轻人在 AI 领域很受关注,甚至被追捧,我想知道即梦团队的平均年龄是多少?人员构成有什么特点?

张楠:我应该是团队里年纪最大的,但我们在组建团队时并不看重年龄,而是看重背后的能力模型以及成员间的协作搭配。

对于探索性业务,我更看重成员是否有好奇心、是否坚持学习,以及是否有韧性。因为探索必然伴随着试错,韧性是支撑我们走下去的关键。

张鹏:即便即梦背靠字节这样的大厂,可能还是会面临一个问题:为什么今天优秀的年轻人,还会选择加入大厂?

张楠:这个问题虽然有点尖锐,但很好。

我自己创过业,所以对「创业」这件事已经祛魅。创业的成功率很低,且过程异常辛苦,很多时候你无法纯粹地做产品,必须分心去处理各种琐碎杂事。

而在字节跳动,有现成的基础设施、技术储备和人才流动机制,这让我能心无旁贷地专注于我擅长的产品本身。

从这个视角看,「创业」只是手段,且未必是成功率最高的手段;而「创造」才是比创业更底层的驱动力。

我关注人生体验,更看重能否把想做的事情做成。

张鹏:这么说,创造其实是比创业更底层的驱动力?

张楠:你这么说,我觉得是。创业是手段,但不是成功率最高的手段。

张鹏:你的经历非常丰富,自己创过业,带领抖音成长为国民级产品,现在又在探索即梦这个全新的方向。未来五年,你最想实现的目标是什么?你最想被满足的好奇心是什么?这个方向现在足够清晰了吗?

张楠:现阶段我们要先做好工具,但我对未来的内容形态有着强烈的好奇心。

我为什么那么喜欢创作者,就像极客公园很喜欢创业者一样,我喜欢跟他们共创做一些新东西的过程,我对于未来的内容形态其实有一些想象,有非常强烈的好奇心想要做一些这样的实验和探索。

其实早在 1960 年代就有过互动电影《Kinoautomat》的实验,还有像 Punchdrunk 的《Sleep No More》这种线下沉浸式戏剧——观众戴着面具在整栋楼里自由探索,跟随角色进入故事。

受这些的启发,我认为未来的讲故事方式可能不再是基于线性的「时间轴」,而是基于「空间图」的空间叙事。

观众不再是单纯的旁观者,而是可以在故事中「行走」。我非常期待 AI 能在未来帮助我们在云端实现这种全新的体验。

张鹏:听起来,这不仅是提升创作者的上限,更可能颠覆现有的内容形态,让观众变成参与者。当然,这一切的前提是先把 AI 工具做好,工具成熟之后,内容形态的创新自然会水到渠成。

张楠:甚至可能跟工具本身的打造也很有关系。

张鹏:这确实是一件让人充满期待的事。非常感谢你今天来到极客公园,分享这么多深刻的思考。期待五年后,你也在你的好奇心上不断有收获,未来再次回到这里和我们分享你的认知!

打开网易新闻 查看精彩图片

转载请联系极客君微信:geekparkGO