为什么你需要这对组合 1.1 NotebookLM 是什么

NotebookLM 是 Google 出的 AI 知识工具。它跟 ChatGPT、Claude 这类通用助手有个很直接的区别:它主要围着你给它的资料工作

你扔进去 10 篇论文,它给出的回答就从这 10 篇里找。每条回答还会带来源,这点很省心——你不用再猜测它的答案是不是胡编的。

NotebookLM 的核心能力:

  • 资料检索:在大文档中精准定位答案
  • 来源标注:每条回答都注明来自哪篇资料
  • 摘要生成:自动提炼长文档的核心要点
  • 问答对话:基于资料进行深入讨论
  • 思维导图:一键生成结构化知识图谱
1.2 单独的 NotebookLM 有什么痛点

很多人用过 NotebookLM 之后会有一个感受:这东西挺好,但就是懒得用

原因很简单——手动流程太烦了:

  • 想加一篇新资料?打开浏览器 → 登录 → 找上传按钮 → 选择文件 → 等上传
  • 想问个问题?打开浏览器 → 登录 → 找到那个笔记本 → 输入问题 → 复制答案 → 切换到笔记软件 → 粘贴整理

偶尔用一两次当然没问题,但要把这套流程放进日常工作每天重复,新鲜劲一过,打开频率就直线下降

这是 NotebookLM 单独使用的卡点:工具本身很强大,但操作成本高到让人不想坚持

1.3 Hermes 在这里扮演什么角色

打开网易新闻 查看精彩图片

Hermes 是一个 AI Agent 框架,它的核心能力是操控工具、执行动作。把它接在 NotebookLM 前面之后:

  • 采集环节:你跟 Hermes 说"把这个视频加到笔记里",它自动下载、分析、上传
  • 投喂环节:你跟 Hermes 说"把这些资料加到笔记本",它自动完成
  • 执行环节:你跟 Hermes 说"生成一个思维导图",它调用 notebooklm-py,自动生成并保存
  • 问答环节:你跟 Hermes 说"根据这几篇资料回答问题",它去 NotebookLM 查,返回结果

一句话:Hermes 负责说,NotebookLM 负责想。 你只需要用自然语言下命令,剩下的全部自动化。

02 这套组合能做什么 2.1 最基础的用法:把 NotebookLM 当成 Hermes 的外接知识库

接上之后,你在 Hermes 里直接用自然语言就能操作 NotebookLM,浏览器都不用开

列出所有笔记本

跟 Hermes 说一句"列出 NotebookLM 所有的笔记",它会直接调 CLI,把你的 Notebook 全列出来。名字、ID、创建时间,一次给全。

往笔记本里加资料

比如你在 YouTube 上刷到一个介绍视频,想存进笔记里。直接跟 Hermes 说:

把这个视频加到 "Hermes Agent" 笔记里:Hermes Agent Just Got 10x BETTER (Curator Explained)

它不光把视频加进去了,还会顺手套一系列后续问题:要不要列资料?要不要等处理完之后直接提问?要不要生成摘要?

它像个会往前走一步的 Agent,不只是把命令原样执行完。

直接提问

资料加进去之后,想了解某个概念,直接问 Hermes:

根据 "Hermes Agent" 笔记里的资料,Curator 是什么?它解决了什么问题?

Hermes 会自己去 NotebookLM 里查,然后基于刚加进去的资料给你答案。从"加资料"到"问问题",整个过程都在终端里完成。

生成结构化输出

问完之后,想把某个概念的整条脉络理清楚,继续说:

根据 "Hermes Agent" 笔记里的资料,用 NotebookLM 帮我生成一个 Curator 的思维导图,并保存到桌面

Hermes 先调用 notebooklm generate mind-map 生成思维导图,再自动下载到桌面。整个过程不到 20 秒。

拿到的是一个结构化 JSON 文件,根节点是 Hermes Agent,下面有 7 个子节点,后面拿去可视化或者转图片都行。

两端同步

还有个很舒服的点:你在终端里做的事,NotebookLM 网页版会同步显示。加视频、提问、生成脑图,都在。

所以用法基本是这样:高频操作放在终端里跑,需要回看或继续追问的时候,再去网页版。两边是通的。

这些动作单独看都不复杂,连起来就很像一个完整的知识库操控台。以前那些开浏览器、登录、找 Notebook、手动上传的步骤,现在基本都压缩成一句话。

2.2 进阶场景:知识会自己滚起来

这套组合不只是"学一个新概念"的工具。

作者自己后来还拿来做:日常信息消化、技术选型调研、课程素材准备。背后的逻辑一直没变:Hermes 负责采集和执行,NotebookLM 负责理解和输出。

而且这套组合有一个很关键的特点:知识会自己往前滚

Hermes 和 NotebookLM 一旦接通,知识不会再只是"存着"。它会开始流动起来:

采集 → 整理 → 提问 → 生成 → 回写 → 下一次继续用前一次留下来的东西就成了新起点

这个飞轮一旦转起来,知识沉淀才开始变得真实。

03 为什么我觉得这套值得长期留着用 3.1 省 Token,也省脑子里的上下文负担

Hermes 用久了之后你会很明显地感觉到一件事:资料一多,每次对话都得先想这次该带哪些背景进去

几篇文档、项目说明、前面的讨论记录,一股脑塞进 prompt 里,token 很容易就上去。更麻烦的是,你每次都要自己判断取舍:带少了它不知道背景,带多了上下文又容易爆。

接上 NotebookLM 之后,这个判断成本会轻很多。

大堆资料放到 NotebookLM 里,让它去管检索和理解;Hermes 就专心干当前的活,只有在需要的时候再去拿那一小段关键信息。

资料还是那些资料,但不用每次都搬一遍。

3.2 知识会自己往前滚

这点是我后来越用越上头的地方。

你平时从别的地方转给 Hermes 的内容——微信里看到的文章、群里别人甩过来的链接、Twitter 上的一串讨论——后面想深挖的时候,都可以继续塞进 NotebookLM。

用久一点之后,NotebookLM 里会慢慢积累出一批你自己筛过、消化过的资料。到你再写新东西的时候,起点已经不再是空白页了。

这套流程怎么搭看完前面的场景,如果你已经有点想试,下一节就够用了。

04 怎么搭建这条链路

搭建本身没有想象中那么重。而且这件事本身也可以交给 Hermes 来做。

Step 1:安装 notebooklm-py,让 Hermes 能直接操作 NotebookLM

这一步是关键。这里用的是一个叫 notebooklm-py 的开源 CLI 工具。它可以让你直接通过命令行操作 NotebookLM:创建笔记本、添加资料、提问、拿摘要,这些都能走命令。

安装这一步你可以直接交给 Hermes。跟它说一句:

阅读 GitHub 项目 https://github.com/win4r/notebooklm-py 的安装说明,并且安装

然后 Hermes 就会自己去读文档、自己安装。

装完之后跑一下 notebooklm --version。如果看到 NotebookLM CLI, version 0.3.4,基本就通了。

Step 2:登录认证,让 Hermes 拿到 NotebookLM 的钥匙

工具装好之后,还差登录这一步。开一个新的终端,执行 notebooklm login。这个命令会自动弹出 Chrome 登录页,你在里面登自己的 Google 账号就行。登录完成之后按一下回车,认证信息就会保存下来。

Step 3:验证打通,让 Hermes 列出你的笔记本

到这一步,跑一下 notebooklm list。只要能顺利列出你的笔记本,链路就通了。前面那些基础操作,到这里就都能用了。

05 避坑清单

  1. 不要跳过认证步骤:每次重新开终端都需要重新认证,如果跑命令报错,先检查是否已登录
  2. 大文件上传需要等待:视频和大型 PDF 上传不是即时的,等 Hermes 反馈 "处理完成" 再提问
  3. 思维导图是 JSON 格式:需要后续处理才能变成图片,不要期待直接生成 PNG
  4. 多笔记本管理:资料多了之后记得给笔记本起清晰的名字,不然回头找不到
  5. Hermes 版本要新:Curator 功能是新版本才有的,旧版可能没有部分命令
06 写在最后

从 Obsidian + LLM Wiki 到这次的 NotebookLM,我越来越确定一件事:Hermes 适合放在中间,专门负责把采集、整理、投喂、执行这些动作串起来

这样一来,你跟信息之间的关系会轻松很多。很多重复动作都有人接手,你就把精力留给判断、取舍和真正需要自己动脑子的部分。

如果你本来就在折腾个人知识管理,这套很值得自己跑一遍。链路一旦通了,后面很多玩法都会自己冒出来