12月18日,剪映业务负责人张楠在火山引擎Force冬季大会上发表演讲。她表示,正如抖音是记录美好生活的“真实世界”的相机,借助GenAI技术,即梦希望成为“想象力世界”的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。
即梦AI是剪映于今年5月上线的AI内容平台,支持通过自然语言及图片输入,生成高质量的图像及视频。
“这种极其简单的方式,可以把每个人脑子里的奇思妙想快速视觉化,像做梦一样,”张楠说,“而这也是‘即梦’这个产品和名字的由来”。
她表示,鉴于目前产品和技术都还在非常早期的阶段,相比于“什么是最好的产品技术范式”,更想谈谈即梦最关注的事情:想象的力量。
以下是张楠演讲内容实录:
大家好,好久不见。
感谢火山引擎大会的邀请,很开心今天在这里和大家交流。其实,作为一个“ i 人”,每次在这种时刻我都很紧张。并不是没有表达欲,只是语言作为一种模态、一种媒介,确实不够丰富立体,常常表达不出我脑子里那些天马行空的想法。所以,请大家发挥想象力,脑补一下我没有表达好的地方。
01.
即梦的起源
今天的主题是,聊聊即梦。
不知道大家是否观察过一个婴儿的成长过程?他们会用眼睛“扫描”这个世界,用耳朵聆听这个世界,用小手、小脚来触摸这个世界。这是他们对“世界”建模的过程。在这个过程中,婴儿开始逐渐区分“真实世界”和“想象世界”。在真实世界里,我们已经可以熟练使用100多年前就发明的摄影术,来捕捉光影。就像我们用抖音“记录美好生活”一样,保存美好的时光。抖音,是一个“真实世界”的相机。既然如此,那想象的世界,是不是也可以有一个像抖音一样,用来记录和表达的相机呢?
2022 年的一个早上,我在一个播客里听到了 DALL·E 2,就在那个瞬间,一个久久盘旋在我脑子里的念头被点亮了:这不就是想象力的相机吗?你只需要输入某一刻的想法,借助 GenAI 的技术,画面就可以瞬间被呈现在眼前。这种极其简单的方式,可以把每个人脑子里的奇思妙想快速视觉化,像做梦一样。而这也是“即梦”产品和名字的由来:我们希望借助即梦这个想象力的相机,帮助每一个有想法的人轻松表达、自由创作。
不过,目前的产品和技术都还在非常早期的阶段,还不成熟。所以,今天我不会去谈什么是最好的产品技术范式。而是想谈谈即梦最关注的事情:想象的力量。人类所有的发明创造都始于想象,想象力是每个人大脑里那些表达出来的和未曾表达出来的念头、画面、情绪、思想、创意和故事。
有科学家估算过,人的一生可以容纳 10 亿个想法。我们大脑里神经元的数量甚至和宇宙中恒星的数量差不多,可见人类的想象力是多么活跃和丰富。如果我们把每个人脑子里精彩的想法,都用视觉语言表达出来,那将是一个多么庞大的多元宇宙,多么丰富的精神世界。所以,想象力不应该被现实束缚,更不应该被技术门槛所遮蔽。我们应该用未来的技术,创造一个想象力的相机,让更多人像设计师、作家、导演一般,充分地表达想象,向世界展现他们的创意和故事。
我特别喜欢“Art makes people human.”这句话。艺术让人思考生命的意义,而美和意义是人类特有的精神追求。天马行空的想象力、对常规事物的突破,这种超越性也正是我们希望即梦和大家一起探索的。
下面和大家分享两个短片,分别来自即梦的两位创作者。
第一个短片的创作者是小文,她是编剧,也是一位戏剧学院的老师。她用了不到5天的时间,制作了这个动人的故事,还原了电影的发展史,从默片时代到有声时代,讲述了一位女明星的奇幻旅程。
另一部作品,则是科幻短剧《觉醒》,一共8集,来自悟空AI团队,这个团队只有3个人,他们用了3个多月的业余时间,完成了这部巨作。在抖音上,收到了广泛的关注和好评,也是首部单日点赞破 40 万的 AI 短剧。
下面请欣赏:
AI短片《绿宝石》by即梦创作者小文
AI科幻短剧《觉醒》 by即梦创作者悟空AI团队
谢谢两位创作者的精彩作品。虽然现在的产品和技术还只是雏形,但每次打开即梦,那些精心打磨的作品,总是让我非常敬佩和感动,让我为创作者们的想象力惊叹不已。从最开始的纯视觉冲击,到有叙事结构的故事短片;从作曲、作词、演绎都是由 AI 完成的 MV,再到最近的动态海报,人工智能已经在改变我们想象和创造这个世界的方式了。
02.
即梦希望成为一种新的“创造和体验”的方式
试想一下,未来创作的时候,你身边会有一个世界上最强大的跨学科专家团队:你的专属AI agent,不仅精通各学科的知识,还兼具艺术家的审美和最强的执行力,能将你需要的不同领域的元素,融入到作品当中。同时,它还具备非凡的推理能力,可以和你深入探讨各种问题,进行真正的头脑风暴,持续激发你的创意,拓宽你认知的边界,你根本无法预测接下来会碰撞出什么更精彩的创意。
当你的视频故事需要一个独特的世界观时,它不仅可以帮你构建时代背景、人物弧光、情节冲突,甚至还能为你无限推演剧情的不同走向。最令人惊艳的是,这一切创作的过程,也许不像传统的电影创作那样,需要从文字开始,而是可用最符合直觉的交互方式来进行。就像我们面前的真实世界,眼睛可以看到,耳朵可以听到,双手可以交互。In Your Eyes, Be Your Eyes.
随着视频创作的变化,消费也会变化。今天,人们还是被动地观看一个视频,跟随导演的蒙太奇,体验剧情的起伏,但未来的故事体验是否还有别的可能性?体验者是否有可能从故事的任意位置进入,跟随自己喜欢的角色去探索故事的不同分支?又或者,有更个性化的剧情发展,而不再追随导演的安排?
甚至我们还可以脑洞再大一点。很多艺术家和诗人都是在半睡半醒之间创作,也许未来即梦可以结合专业的脑电波设备,帮助人们把睡觉时的梦境记录下来,把猫咪、小狗甚至是一棵树的脑电波和生物磁场,用可视化的方式表达出来,探索潜意识、甚至是无意识的创作,呈现不同物种在这个世界上的想象和表达。
其实想象力的局限,永远不是技术的局限,而是认知的局限。在 AI 的时代,无限画布可以变成空间画布。创作的过程可以是跳出过往任何经验的发散和思想实验,GenAI 如果是一种“语言”的话,应该是更广泛的多模态的语言,应该包含世间万物,智能也应该有更广义的理解。我们希望即梦可以激发每个人的想象力,成为想象力的相机,帮助每个人来表达,创造独特的体验和价值。
热门跟贴