Claude Code的体验确实好,但Anthropic的API账单涨得更快。一个开源项目free-claude-code给出了替代方案:保留Claude Code的完整工作流,把底层API调用全部路由到免费或本地模型。
这个代理的运作逻辑很直接。Claude Code的每次操作原本都直连Anthropic API,现在中间插入一层转换:客户端发出的请求先到free-claude-code代理,代理把Anthropic格式的请求翻译成各服务商的格式,收到回复后再转回Anthropic格式。对Claude Code来说,这一切完全透明。
目前支持10个后端,包括NVIDIA NIM、OpenRouter、Ollama等。关键特性是分层路由:Claude Code内部把请求分为Opus(主代理)、Sonnet、Haiku(子代理)三个层级,代理允许每层指向不同模型。比如把最贵的Opus请求导向OpenRouter的免费模型,Haiku请求走本地Ollama。
安装需要Claude Code CLI和Python uv。用uv tool install命令装完代理后,启动fcc-server,在浏览器打开本地地址配置各服务商的API key。之后用fcc-claude代替原来的claude命令,启动器会自动注入必要的环境变量。
IDE集成也覆盖到了。VS Code在settings.json里加三段配置:ANTHROPIC_BASE_URL指向代理地址、ANTHROPIC_AUTH_TOKEN设为freecc、开启网关模型发现。JetBrains同理,编辑ACP配置文件加入相同变量。配置完后IDE里的模型选择器也能正常工作,因为代理的/v1/models端点会暴露所有可用模型。
项目还带了两个可选功能:Discord/Telegram机器人封装Claude Code会话,支持远程任务管理和流式进度推送;语音转文字接入Whisper或NVIDIA NIM,通过消息平台输入语音指令。不过这两项需要额外配置bot token和频道ID。
实际限制需要清醒认识。Claude Code的核心优势——长上下文、精准的工具调用、复杂推理——很多是Claude模型特有的。换用替代模型后,agent可靠性会下降,尤其是工具调用准确率,而这正是Claude Code工作流的关键。免费层还有速率限制,NVIDIA NIM和OpenRouter的免费模型通常有RPM/TPD上限,重度使用会触发限流。本地模型则要自己扛算力成本。
热门跟贴