过去一年,我折腾了各种本地大模型配置——换显卡、测量化、跑分对比。但真正让我每天愿意打开它的,不是硬件升级,而是五个几乎零成本的工作流调整。
这些技巧不涉及购买新设备,也不依赖最新模型。它们解决的是一个被忽视的问题:让本地AI从"能用"变成"想用"。
技巧一:告别空白对话
以前每次新开聊天,我都要重复介绍自己:用什么工具、写什么风格、当前在做什么项目。这种"面试式启动"消耗了大量时间。
现在我维护了几个简单的上下文文件,包含写作偏好、进行中的项目、常用文章结构。模型随时能调用这些信息。响应变得一致、个性化,不再像面对一个陌生人。
使用体验从"每次 briefing"变成了"继续对话"。
技巧二:模板比模型更重要
我曾以为新模型会自动提升效率。实际上,可复用的模板作用更大。我为常见任务建立了固定结构:博客大纲、文章摘要、研究笔记、编辑检查清单。
现在坐下写作时,工作流已经就绪。填入主题,让模型继续即可。这消除了大量心理摩擦——花时间从"怎么问"转移到"想什么"。
讽刺的是,结构化的指令让较小的本地模型也输出更好结果。好流程胜过追跑分。
技巧三:给模型本地记忆
本地LLM有个致命盲区:它不了解我的实际生活、过往项目或本地文件。每次需要引用旧文章,都得手动复制粘贴。
我在数字档案库上搭建了一个简单的检索增强生成(RAG)系统。现在模型自动从本地Markdown文件、项目笔记和存档文章中提取相关上下文。
这意味着我可以问"上次那篇关于X的文章里我提到了什么"或"基于我2023年的笔记,总结Y主题"。本地AI终于能利用我多年积累的实际工作成果,而不只是训练数据中的通用知识。
技巧四:深度系统集成
把本地LLM从浏览器标签页解放出来,是另一个关键转变。我通过API将其接入日常工具:编辑器、笔记应用、命令行。
现在选中一段文字按快捷键就能重写,在笔记应用里直接生成摘要,用命令行批量处理文件。AI变成了基础设施的一部分,而非需要专门打开的应用。
这种无缝集成大幅降低了使用门槛。当AI随处可用时,你会更频繁地用它解决小问题,而不只是偶尔处理大任务。
技巧五:建立反馈循环
最后一个调整是系统性地收集和复用有效输出。每次模型给出特别有用的响应,我会保存提示词和上下文配置。
几个月后,我积累了一个个人优化的提示词库。这些不是网上抄的通用模板,而是针对我特定工作流调试过的版本。新项目的启动速度越来越快,因为基础框架已经验证过。
核心洞察
这五个技巧的共同点:它们都不改变模型本身,而是改变我与模型的交互方式。本地LLM的最大优势不是隐私或成本,而是可定制性——你可以按照自己的习惯改造整个体验。
如果你也在运行本地AI,不妨先别急着升级硬件。花一个下午优化上下文、建几个模板、接一两个常用工具。实际生产力的提升,可能远超换一块新显卡。
热门跟贴