你懒得看笔记？谷歌直接把它变成60秒竖屏解说视频|知名企业|短视频|竖屏|谷歌

阅读堆积成山的笔记，或者面对一份50页的研究文档，赶上时间紧张，确实没人发自内心想啃完。谷歌显然捕捉到了这个情绪，于是对它的人工智能笔记工具NotebookLM进行了一次大幅升级。现在，你只需把文档上传，它就能自动生成一段60秒的竖屏短视频，用讲故事的方式把核心内容梳理出来。

不熟悉NotebookLM的人可以把它理解为，一个起初定位简单的AI研究助手，现在正在演变成功能更强劲的学习工具。这次的“短视频概览”功能，是在之前“电影式视频概览”基础上的进一步拓展。但更大的亮点，是它背后驱动的引擎——谷歌最新的图像生成模型。

据谷歌官方披露，驱动这项短视频功能的模型被命名为Gemini 3.1闪存精简图像（Gemini 3.1 Flash-Lite Image），内部代号“纳米香蕉2代精简版（Nano Banana 2 Lite）”。官方称，这是谷歌迄今为止速度最快、成本效益最高的图像生成模型。它把单张图像的生成时间压缩到了四秒，同时在视觉质量上，比上一代Gemini 2.5闪存图像（初代“纳米香蕉”）有明显的跃升。这个引擎把广泛的世界知识和角色塑造的一致性结合在了一起，能够快速准确地勾勒场景，开发故事板工具，甚至在制作本地化广告时，在不丢失物体保真度的前提下，渲染出清晰易读的文字排版。

当你在NotebookLM中使用“短视频概览”时，便会激活这个模型。它会把你提供的源材料浓缩成一段竖屏视频，里头塞满了叙事讲解和教学动画。

这项功能的目标用户很明确：那些正在复习笔记、准备演示文稿，或是面对冗长PDF文件，只想要抓住关键要点的人。在生成视频之前，你需要从输出格式里选择“短篇”选项（旁边还有“解说”和“电影式”可选），然后指定要引用的素材来源，再通过一个自定义提示或系统推荐的话题来框定视频的焦点。

配合此次更新，谷歌同时也把Gemini Omni Flash推进了公开预览阶段。这个模型瞄准的是全视频生成能力，支持用自然语言进行对话式编辑（比如调整场景光照、替换角色），并接受多模态输入。

它的一个原生特性是能为每段视频输出配对音频，并且让屏幕上的文字与动态运镜保持同步。

不过，“短视频概览”功能目前尚未向所有用户全面推送。按照谷歌的计划，这项功能将在未来几周内，逐步向年满18岁的英语用户开放。一旦正式上线，无论你是在网页端、安卓还是苹果设备上，只要登录了常规的个人账户或谷歌办公套件（Google Workspace）账号，都能用上它。

如果你是一名为了期末考试而临阵磨枪的学生，或者只是单纯不想啃那些信息密度过高的报告，把一份长得让人头疼的资料直接转换成一段高质量的解说视频，你可能很快就会发现，自己之前面对海量资料时的畏难情绪，被机器毫不客气地看穿了。