大家好,我是 Ai 学习的老章

建议阅读前文以做到无缝衔接:

介绍一系列我最近使用Gemini-CLI的骚操作

帮我“看”视频

有些视频看过之后感觉意犹未尽,或者视频“太长不想看”

可以下载了让 Gemini 总结成文章

比如把 B 站视频下载了

让 Gmini 转录成文字稿后总结,它不能直接转录,可以让其用其他工具进行处理

比如先用 ffmpeg 抽取出音频

Gemini-CLI 是可以理解音频的,但是不能超过 20MB

这怎么办?可以绕道 Whipser 转录

这里我事先安装了 Whisper,它会自动执行转录命令

转录后的全部字幕

最后是总结,注意⚠️Whipser 用的 tiny 模型很多错别字,这也无所谓,让 Gemini 改就行了

首次执行这一系列任务需要安装工具,后续就可以梭哈了

目前的处理都在本地,如果 API 支持视频输入就好了,不过也不可能处理太大尺寸的视频,这个角度看,本地处理还是方便的

帮我“听”播客

音频就好说了,低于 20MB Gemini 可以直接处理,超过的可以按上面方式处理

它可以下载论文,后面我还配置了 arxiv-mcp-server,就更方便了

它还热心的帮忙解压了

直接阅读论文和解读、总结是小事儿,还能让他把 arxiv Tex 格式论文转成 PPT

帮我做 PPT

可以让 Gemini-CLI 生成 Beamer 的 Presentation

之前介绍过提示词:@arXiv-1706.03762v7 Generate a Beamer presentation based on the attached literature, the output format is tex code, and ensure the code is accurate and error-free. The code needs to include the relative paths of all images from the attachment.

这一步也需要提前安装好工具,比如 pdflatex

成品如下,当然也可以生成中文版,这里可能就稍微麻烦点了

详细可以看

在使用 Gemini-CLI 很多天后我才注意到它还有 N 多用法:https://github.com/google-gemini/gemini-cli/blob/main/docs/cli/commands.md

太长不看,直接让 Gemini-CLI 总结 Gemini-CLI 的用法。。。大家可以一起学习一下

根据官方文档,这里是 Gemini CLI 命令的摘要。

这些命令根据其前缀分为三种类型:斜杠 (/)、艾特 (@) 和感叹号 (!)。

斜杠命令 (/)

这些命令用于控制 CLI 应用程序本身。

  • /about: 显示版本信息。

  • /auth: 打开一个对话框来更改身份验证方法。

  • /bug: 提交 Gemini CLI 的错误报告。

  • /chat: 管理对话历史。

    • save : 使用标签保存当前对话。

    • resume : 恢复之前保存的对话。

    • list: 列出所有已保存的对话标签。

  • /clear: 清除终端屏幕(快捷键:Ctrl+L)。

  • /compress: 用摘要替换当前的聊天上下文以节省令牌。

  • /editor: 打开一个对话框来选择支持的编辑器。

  • /help(或/?): 显示关于命令的帮助信息。

  • /mcp: 管理模型上下文协议 (MCP) 服务器和工具。

    • desc: 显示服务器和工具的详细描述。

    • nodesc: 隐藏工具描述。

    • schema: 显示工具参数的完整 JSON 模式。

  • /memory: 管理来自GEMINI.md文件的 AI 指令性内存。

    • add : 将提供的文本添加到 AI 的内存中。

    • show: 显示当前内存的全部内容。

    • refresh: 从所有GEMINI.md文件中重新加载内存。

  • /restore [tool_call_id]: 将项目文件恢复到执行特定工具之前的状态。

  • /stats: 显示会话统计信息,包括令牌使用情况。

  • /theme: 打开一个对话框来更改 CLI 的视觉主题。

  • /tools: 列出可用的工具。

    • desc: 显示详细的工具描述。

    • nodesc: 隐藏工具描述。

  • /quit(或/exit): 退出 Gemini CLI。

@命令

这些命令用于在您的提示中包含文件或目录的内容。

  • @path/to/file@path/to/directory: 将指定文件或目录的内容注入到提示中。该命令能够感知 git,并默认排除.gitignore中列出的文件。

  • @(单独使用): 将字面的@符号传递给模型,用于当您想讨论该符号本身时。

Shell 命令 (!)

该前缀允许您直接与系统 shell 交互。

  • !: 在您的系统 shell 中执行给定的命令并显示输出。

  • !(单独使用): 切换“shell 模式”。激活后,所有输入都将被视为 shell 命令,直到您再次关闭该模式。

帮我整理文件

Gemini-CLI 最大优势就是拥有访问用户电脑所有数据的能力,命令行可以执行一系列命令,支持图片、pdf 等

给图片改格式,重命名,整理文件夹都不在话下

配置 MCP

Gemini-CLI 还支持 MCP

它的配置文件在根目录.gemini 下的 setting.json

比如我要配置一个从 arxiv 下载、阅读、总结论文的 MCP

{   "mcpServers": {     "arxiv-mcp-server": {       "command": "/Users/zz/miniconda3/bin/uv",       "args": [         "tool",         "run",         "arxiv-mcp-server",         "--storage-path",         "/Users/zz/Desktop/paper/pdf"       ]     }

配置的时候要注意格式,必须与 theme 放在一起

制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个,谢谢你看我的文章,我们下篇再见!