上周三下午,我正在开发一个编辑平台的新功能。这项工作需要同时处理管理后台、服务器端和前端平台,必须保持完整的上下文连贯。就在关键节点,Claude的每周限额突然耗尽,系统提示需要等待五天才能恢复。
这种中断对开发节奏是致命的。我使用的是Claude Opus 4.7,在VS Code中以资深工程师级别进行开发,但订阅服务的硬性限制和意外账单让我开始寻找替代方案。经过大量研究,我搭建了一套完全免费的本地AI编程环境:Ollama配合Continue.dev插件,直接在VS Code中运行。
这套方案现在承担了我大部分日常编码工作,效果出乎意料地好——部分任务的处理质量已接近Claude Opus 4.7的水平。以下是经过实测的完整配置流程。
核心优势
这套本地方案解决了订阅制服务的几个痛点:无需等待重置周期,没有信用额度或按量计费的陷阱,下载完成后可完全离线运行,代码始终留在本地机器确保隐私,且支持在多个免费模型之间灵活切换。
环境准备
测试设备为MacBook Air M1。首先访问ollama.com下载并安装Ollama,注意选择对应的操作系统版本。安装完成后打开应用,它将在后台运行。打开任意终端(可直接使用VS Code内置终端),运行命令ollama list,首次执行应显示为空列表。
接下来下载两个核心模型。在终端中依次执行:
ollama pull qwen2.5-coder:7b
ollama pull deepseek-coder-v2:16b
等待下载完成。Qwen 2.5 Coder 7B的下载体积约4.7GB,DeepSeek Coder V2 16B约8.9GB。
VS Code插件配置
打开VS Code,点击左侧或右侧边栏的扩展标签,搜索"Continue"(由Continue团队开发,通常为首个结果),完成安装后插件立即出现在侧边栏。
配置环节需要特别注意。点击Continue顶部工具栏的齿轮图标进入设置,选择左侧的"configs"标签打开配置面板。将config.yaml文件内容完全替换为以下配置:
name: Local Config
version: 1.0.0
schema: v1
models:
- name: Qwen2.5 Coder 7B
provider: ollama
model: qwen2.5-coder:7b
- name: DeepSeek Coder V2 16B
provider: ollama
model: deepseek-coder-v2:16b
- name: Qwen 1.5B Autocomplete
provider: ollama
model: qwen2.5-coder:1.5b
roles:
- autocomplete
tabAutocompleteModel:
name: Qwen 1.5B Autocomplete
provider: ollama
model: qwen2.5-coder:1.5b
保存文件后关闭配置面板,本地AI编程环境即告就绪。
热门跟贴