960KB的AI代理胶囊：本地大模型终于能"打包带走"了|ai代理胶囊|kb|websocket|工作流|服务器|调用

一个HTML文件就能跑完整的AI代理？GemmaPod把这个想法变成了现实。这个开源项目把本地大语言模型、工具链、工作流和身份认证，全部塞进了一个960KB左右的签名文件里。你可以把它当邮件附件发出去，也可以一行代码嵌入网页，甚至直接丢到CDN上分享。

传统AI代理的部署像搬家——服务器、依赖、配置、密钥，少一样都跑不起来。GemmaPod的思路是"胶囊化"：一个文件即完整产品。文件内部包含WebAssembly编译的推理引擎、JavaScript运行时、加密的身份证书，以及代理的人格设定和工具接口。接收方双击打开，浏览器就是运行环境。

技术架构上有几个关键设计。传输层叫DARTC，基于WebRTC DataChannels做实时通信，签名消息支持多路复用。如果点对点连不通，自动降级到WebSocket中继。协议层同时实现了MCP（模型上下文协议）和A2A（代理间通信），意味着这个本地代理可以调用外部工具，也能和其他代理协作。隐私数据不出本机，或者按部署者指定的边界流动。

创建流程被压缩到一条命令：npx gemmapod create。执行后当前目录生成签名HTML文件，前提是需要本地跑着Ollama，或者提供一个OpenAI兼容的API端点。打开文件直接对话，内置了Vercel AI SDK用于复杂工作流，也可以对接Mastra框架做多步骤任务编排。

项目作者举了个有趣的例子：GemmaPod官网首页那个动态Hero区域的智能代理，实际上正跑在他家里的Mac Mini上。访客浏览器通过DARTC直连这台设备，推理完全本地完成。这种"个人服务器即服务"的模式，绕开了传统云部署的账单和合规负担。

GitHub仓库已开源，主站提供在线体验。对于想把自己微调的本地模型变成可分发产品的开发者，这个方案省去了容器化、API网关、认证系统的一整套工程。一个文件发给别人，对方零配置运行——这种便携性在AI代理领域确实少见。