上周三下午,我正在开发一个编辑平台的新功能。这项工作需要同时处理管理后台、服务器端和前端平台,必须保持完整的上下文连贯。就在关键节点,Claude的每周限额突然耗尽,系统提示需要等待五天才能恢复。

这种中断对开发节奏是致命的。我使用的是Claude Opus 4.7,在VS Code中以资深工程师级别进行开发,但订阅服务的硬性限制和意外账单让我开始寻找替代方案。经过大量研究,我搭建了一套完全免费的本地AI编程环境:Ollama配合Continue.dev插件,直接在VS Code中运行。

打开网易新闻 查看精彩图片

这套方案现在承担了我大部分日常编码工作,效果出乎意料地好——部分任务的处理质量已接近Claude Opus 4.7的水平。以下是经过实测的完整配置流程。

核心优势

这套本地方案解决了订阅制服务的几个痛点:无需等待重置周期,没有信用额度或按量计费的陷阱,下载完成后可完全离线运行,代码始终留在本地机器确保隐私,且支持在多个免费模型之间灵活切换。

环境准备

测试设备为MacBook Air M1。首先访问ollama.com下载并安装Ollama,注意选择对应的操作系统版本。安装完成后打开应用,它将在后台运行。打开任意终端(可直接使用VS Code内置终端),运行命令ollama list,首次执行应显示为空列表。

接下来下载两个核心模型。在终端中依次执行:

ollama pull qwen2.5-coder:7b

ollama pull deepseek-coder-v2:16b

等待下载完成。Qwen 2.5 Coder 7B的下载体积约4.7GB,DeepSeek Coder V2 16B约8.9GB。

VS Code插件配置

打开VS Code,点击左侧或右侧边栏的扩展标签,搜索"Continue"(由Continue团队开发,通常为首个结果),完成安装后插件立即出现在侧边栏。

配置环节需要特别注意。点击Continue顶部工具栏的齿轮图标进入设置,选择左侧的"configs"标签打开配置面板。将config.yaml文件内容完全替换为以下配置:

name: Local Config

version: 1.0.0

schema: v1

models:

- name: Qwen2.5 Coder 7B

provider: ollama

model: qwen2.5-coder:7b

- name: DeepSeek Coder V2 16B

provider: ollama

model: deepseek-coder-v2:16b

- name: Qwen 1.5B Autocomplete

provider: ollama

model: qwen2.5-coder:1.5b

roles:

- autocomplete

tabAutocompleteModel:

name: Qwen 1.5B Autocomplete

provider: ollama

model: qwen2.5-coder:1.5b

保存文件后关闭配置面板,本地AI编程环境即告就绪。