零成本用Claude Code：开源代理把API账单砍到零|code|工作流|开源代理|调用

Claude Code的体验确实好，但Anthropic的API账单涨得更快。一个开源项目free-claude-code给出了替代方案：保留Claude Code的完整工作流，把底层API调用全部路由到免费或本地模型。

这个代理的运作逻辑很直接。Claude Code的每次操作原本都直连Anthropic API，现在中间插入一层转换：客户端发出的请求先到free-claude-code代理，代理把Anthropic格式的请求翻译成各服务商的格式，收到回复后再转回Anthropic格式。对Claude Code来说，这一切完全透明。

目前支持10个后端，包括NVIDIA NIM、OpenRouter、Ollama等。关键特性是分层路由：Claude Code内部把请求分为Opus（主代理）、Sonnet、Haiku（子代理）三个层级，代理允许每层指向不同模型。比如把最贵的Opus请求导向OpenRouter的免费模型，Haiku请求走本地Ollama。

安装需要Claude Code CLI和Python uv。用uv tool install命令装完代理后，启动fcc-server，在浏览器打开本地地址配置各服务商的API key。之后用fcc-claude代替原来的claude命令，启动器会自动注入必要的环境变量。

IDE集成也覆盖到了。VS Code在settings.json里加三段配置：ANTHROPIC_BASE_URL指向代理地址、ANTHROPIC_AUTH_TOKEN设为freecc、开启网关模型发现。JetBrains同理，编辑ACP配置文件加入相同变量。配置完后IDE里的模型选择器也能正常工作，因为代理的/v1/models端点会暴露所有可用模型。

项目还带了两个可选功能：Discord/Telegram机器人封装Claude Code会话，支持远程任务管理和流式进度推送；语音转文字接入Whisper或NVIDIA NIM，通过消息平台输入语音指令。不过这两项需要额外配置bot token和频道ID。

实际限制需要清醒认识。Claude Code的核心优势——长上下文、精准的工具调用、复杂推理——很多是Claude模型特有的。换用替代模型后，agent可靠性会下降，尤其是工具调用准确率，而这正是Claude Code工作流的关键。免费层还有速率限制，NVIDIA NIM和OpenRouter的免费模型通常有RPM/TPD上限，重度使用会触发限流。本地模型则要自己扛算力成本。