大家好,我是 Ai 学习的老章
建议阅读前文以做到无缝衔接:
介绍一系列我最近使用Gemini-CLI的骚操作
帮我“看”视频
有些视频看过之后感觉意犹未尽,或者视频“太长不想看”
可以下载了让 Gemini 总结成文章
比如把 B 站视频下载了
让 Gmini 转录成文字稿后总结,它不能直接转录,可以让其用其他工具进行处理
比如先用 ffmpeg 抽取出音频
Gemini-CLI 是可以理解音频的,但是不能超过 20MB
这怎么办?可以绕道 Whipser 转录
这里我事先安装了 Whisper,它会自动执行转录命令
转录后的全部字幕
最后是总结,注意⚠️Whipser 用的 tiny 模型很多错别字,这也无所谓,让 Gemini 改就行了
首次执行这一系列任务需要安装工具,后续就可以梭哈了
目前的处理都在本地,如果 API 支持视频输入就好了,不过也不可能处理太大尺寸的视频,这个角度看,本地处理还是方便的
帮我“听”播客
音频就好说了,低于 20MB Gemini 可以直接处理,超过的可以按上面方式处理
它可以下载论文,后面我还配置了 arxiv-mcp-server,就更方便了
它还热心的帮忙解压了
直接阅读论文和解读、总结是小事儿,还能让他把 arxiv Tex 格式论文转成 PPT
帮我做 PPT
可以让 Gemini-CLI 生成 Beamer 的 Presentation
之前介绍过提示词:@arXiv-1706.03762v7 Generate a Beamer presentation based on the attached literature, the output format is tex code, and ensure the code is accurate and error-free. The code needs to include the relative paths of all images from the attachment.
这一步也需要提前安装好工具,比如 pdflatex
成品如下,当然也可以生成中文版,这里可能就稍微麻烦点了
详细可以看
在使用 Gemini-CLI 很多天后我才注意到它还有 N 多用法:https://github.com/google-gemini/gemini-cli/blob/main/docs/cli/commands.md
太长不看,直接让 Gemini-CLI 总结 Gemini-CLI 的用法。。。大家可以一起学习一下
根据官方文档,这里是 Gemini CLI 命令的摘要。
这些命令根据其前缀分为三种类型:斜杠 (/)、艾特 (@) 和感叹号 (!)。
斜杠命令 (/)
这些命令用于控制 CLI 应用程序本身。
/about: 显示版本信息。
/auth: 打开一个对话框来更改身份验证方法。
/bug: 提交 Gemini CLI 的错误报告。
/chat: 管理对话历史。
save: 使用标签保存当前对话。resume: 恢复之前保存的对话。list: 列出所有已保存的对话标签。
/clear: 清除终端屏幕(快捷键:
Ctrl+L)。/compress: 用摘要替换当前的聊天上下文以节省令牌。
/editor: 打开一个对话框来选择支持的编辑器。
/help(或
/?): 显示关于命令的帮助信息。/mcp: 管理模型上下文协议 (MCP) 服务器和工具。
desc: 显示服务器和工具的详细描述。nodesc: 隐藏工具描述。schema: 显示工具参数的完整 JSON 模式。
/memory: 管理来自
GEMINI.md文件的 AI 指令性内存。add: 将提供的文本添加到 AI 的内存中。show: 显示当前内存的全部内容。refresh: 从所有GEMINI.md文件中重新加载内存。
/restore [tool_call_id]: 将项目文件恢复到执行特定工具之前的状态。
/stats: 显示会话统计信息,包括令牌使用情况。
/theme: 打开一个对话框来更改 CLI 的视觉主题。
/tools: 列出可用的工具。
desc: 显示详细的工具描述。nodesc: 隐藏工具描述。
/quit(或
/exit): 退出 Gemini CLI。
这些命令用于在您的提示中包含文件或目录的内容。
@path/to/file或@path/to/directory: 将指定文件或目录的内容注入到提示中。该命令能够感知 git,并默认排除.gitignore中列出的文件。@(单独使用): 将字面的@符号传递给模型,用于当您想讨论该符号本身时。
该前缀允许您直接与系统 shell 交互。
!: 在您的系统 shell 中执行给定的命令并显示输出。!(单独使用): 切换“shell 模式”。激活后,所有输入都将被视为 shell 命令,直到您再次关闭该模式。
Gemini-CLI 最大优势就是拥有访问用户电脑所有数据的能力,命令行可以执行一系列命令,支持图片、pdf 等
给图片改格式,重命名,整理文件夹都不在话下
配置 MCP
Gemini-CLI 还支持 MCP
它的配置文件在根目录.gemini 下的 setting.json
比如我要配置一个从 arxiv 下载、阅读、总结论文的 MCP
{ "mcpServers": { "arxiv-mcp-server": { "command": "/Users/zz/miniconda3/bin/uv", "args": [ "tool", "run", "arxiv-mcp-server", "--storage-path", "/Users/zz/Desktop/paper/pdf" ] }配置的时候要注意格式,必须与 theme 放在一起
制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个,谢谢你看我的文章,我们下篇再见!
热门跟贴