用Ollama 装了 Qwen3.5，虽然慢点但真香！

呼呼历史论

2026-04-19 06:22 ·辽宁

今天专门聊聊那个火遍朋友圈的“小助手”——本地大模型。

你是不是也和我一样？天天用通义千问网页版，聊个天挺爽，但心里有个疙瘩：数据传出

去安全吗？隐私有保障吗？

最近试了个新鲜事儿，用 Ollama 自己装了一个本地模型。由于显卡和显存比较拉跨只能装了个4b的版本，虽然感觉有点慢，但保障了那个私密性，今天就把我这“踩坑又走心”的经验掏心窝子告诉你。

为啥非得自己装？慢是真的，但值！

很多朋友说：“网页版多快啊，为啥要折腾本地？”

实话实说：网页版确实快，响应速度秒快。但咱不是追求那个“快”，而是求个“稳”和

“安”。

网页版：数据上云端，大厂能看得到（虽然他们标榜隐私，但咱不信任）。

本地版（Ollama）：数据全在自己家里，想聊啥就聊啥，想存啥就存啥，完全私密

。虽然响应速度一言难尽，但那是“自己家电脑”，安全感拉满！

第一步：搞定 Ollama，只要一条命令

Ollama 是啥？它就是那个本地大模型的“一键部署器”。安装其实超级简单，不需要懂代码，

跟着来就行。

1. 下载 Ollama

Windows/Mac: 去官网（ollama.com）下载对应的安装包，点完就跑，不用折腾。

Linux:执行这一个命令：curl -fsSL https://ollama.com/install.sh | sh

2. 验证是否成功

在终端敲一句：ollama --version。

如果看到版本号，说明你这就成功了！咱开始搞事情了。

第二步：把 Qwen3.5 4b 拉进本地库

直接把那个大模型的“脑袋”拉回自己电脑。

1. 运行拉取命令

打开 Ollama 的界面（或者终端），直接输入：ollama pull qwen3.5:4b

注：这里的版本号可以改为你实际需要的版本号。

2. 等待下载完成

下载完成后，你会看到终端提示 `拉取完成`，这就说明你的 Qwen3.5 已经在你的本地服

务器里了。

3. 开始对话

在终端输入ollama run qwen3.5:4b然后就能开始聊天了，不需要再登录任何账号，纯粹本地运行。

速度 vs 隐私：最终体验报告

试了几天下来，我总结了两个核心感受，大家听听有没有共鸣。

感受一：由于硬件拉跨，感觉只有cpu在出力，显卡在偷懒，确实有点“慢”

如果你习惯了网页版秒回，那本地体验会有落差。特别是长文本，生成一段话可能要等几分钟。这主要是因为算力在自己电脑里，还要加载模型到内存，具体的速度主要是看个人的电脑硬件情况。

感受二：体验真香

但！如果你问：“我要隐私，我要完全可控”，那你必须得选这个。

不需要担心大厂的数据滥用。

模型版本完全自己掌控，今天想换 Qwen3.5，明天想换 Llama，直接拉库就行。

对于开发者、极客，或者对数据敏感的人，这种“慢”是可以忍受的。

最后，咱们一起做个“本地党”吧，技术这东西，有时候不是越快越好，而是适合自己的最好。

如果你也想体验一下把大模型“装进自己家”的感觉，现在就去装个Ollama，试试 Qwen3.5吧，部署在本地虽然慢悠悠但安心。

别忘了点赞收藏，觉得有用的话，转给你的小伙伴，让他也体验一把“本地”的快乐！

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴