一个HTML文件就能跑完整的AI代理?GemmaPod把这个想法变成了现实。这个开源项目把本地大语言模型、工具链、工作流和身份认证,全部塞进了一个960KB左右的签名文件里。你可以把它当邮件附件发出去,也可以一行代码嵌入网页,甚至直接丢到CDN上分享。
传统AI代理的部署像搬家——服务器、依赖、配置、密钥,少一样都跑不起来。GemmaPod的思路是"胶囊化":一个文件即完整产品。文件内部包含WebAssembly编译的推理引擎、JavaScript运行时、加密的身份证书,以及代理的人格设定和工具接口。接收方双击打开,浏览器就是运行环境。
技术架构上有几个关键设计。传输层叫DARTC,基于WebRTC DataChannels做实时通信,签名消息支持多路复用。如果点对点连不通,自动降级到WebSocket中继。协议层同时实现了MCP(模型上下文协议)和A2A(代理间通信),意味着这个本地代理可以调用外部工具,也能和其他代理协作。隐私数据不出本机,或者按部署者指定的边界流动。
创建流程被压缩到一条命令:npx gemmapod create。执行后当前目录生成签名HTML文件,前提是需要本地跑着Ollama,或者提供一个OpenAI兼容的API端点。打开文件直接对话,内置了Vercel AI SDK用于复杂工作流,也可以对接Mastra框架做多步骤任务编排。
项目作者举了个有趣的例子:GemmaPod官网首页那个动态Hero区域的智能代理,实际上正跑在他家里的Mac Mini上。访客浏览器通过DARTC直连这台设备,推理完全本地完成。这种"个人服务器即服务"的模式,绕开了传统云部署的账单和合规负担。
GitHub仓库已开源,主站提供在线体验。对于想把自己微调的本地模型变成可分发产品的开发者,这个方案省去了容器化、API网关、认证系统的一整套工程。一个文件发给别人,对方零配置运行——这种便携性在AI代理领域确实少见。
热门跟贴