阅读堆积成山的笔记,或者面对一份50页的研究文档,赶上时间紧张,确实没人发自内心想啃完。谷歌显然捕捉到了这个情绪,于是对它的人工智能笔记工具NotebookLM进行了一次大幅升级。现在,你只需把文档上传,它就能自动生成一段60秒的竖屏短视频,用讲故事的方式把核心内容梳理出来。

不熟悉NotebookLM的人可以把它理解为,一个起初定位简单的AI研究助手,现在正在演变成功能更强劲的学习工具。这次的“短视频概览”功能,是在之前“电影式视频概览”基础上的进一步拓展。但更大的亮点,是它背后驱动的引擎——谷歌最新的图像生成模型。

打开网易新闻 查看精彩图片

据谷歌官方披露,驱动这项短视频功能的模型被命名为Gemini 3.1闪存精简图像(Gemini 3.1 Flash-Lite Image),内部代号“纳米香蕉2代精简版(Nano Banana 2 Lite)”。官方称,这是谷歌迄今为止速度最快、成本效益最高的图像生成模型。它把单张图像的生成时间压缩到了四秒,同时在视觉质量上,比上一代Gemini 2.5闪存图像(初代“纳米香蕉”)有明显的跃升。这个引擎把广泛的世界知识和角色塑造的一致性结合在了一起,能够快速准确地勾勒场景,开发故事板工具,甚至在制作本地化广告时,在不丢失物体保真度的前提下,渲染出清晰易读的文字排版。

当你在NotebookLM中使用“短视频概览”时,便会激活这个模型。它会把你提供的源材料浓缩成一段竖屏视频,里头塞满了叙事讲解和教学动画。

这项功能的目标用户很明确:那些正在复习笔记、准备演示文稿,或是面对冗长PDF文件,只想要抓住关键要点的人。在生成视频之前,你需要从输出格式里选择“短篇”选项(旁边还有“解说”和“电影式”可选),然后指定要引用的素材来源,再通过一个自定义提示或系统推荐的话题来框定视频的焦点。

配合此次更新,谷歌同时也把Gemini Omni Flash推进了公开预览阶段。这个模型瞄准的是全视频生成能力,支持用自然语言进行对话式编辑(比如调整场景光照、替换角色),并接受多模态输入。

它的一个原生特性是能为每段视频输出配对音频,并且让屏幕上的文字与动态运镜保持同步。

不过,“短视频概览”功能目前尚未向所有用户全面推送。按照谷歌的计划,这项功能将在未来几周内,逐步向年满18岁的英语用户开放。一旦正式上线,无论你是在网页端、安卓还是苹果设备上,只要登录了常规的个人账户或谷歌办公套件(Google Workspace)账号,都能用上它。

如果你是一名为了期末考试而临阵磨枪的学生,或者只是单纯不想啃那些信息密度过高的报告,把一份长得让人头疼的资料直接转换成一段高质量的解说视频,你可能很快就会发现,自己之前面对海量资料时的畏难情绪,被机器毫不客气地看穿了。