Redis创始人Antirez又搞了个大新闻。

这次不是数据库,而是一个叫ds4的开源项目——专门为DeepSeek V4 Flash写的原生推理引擎,只有几千行C代码。

它做到了一件很多人觉得不可能的事:把拥有1M上下文窗口、能跑完整coding agent循环的准前沿模型,完整跑在一台普通的128GB MacBook Pro上。

YC CEO Garry Tan看完直接转发:"正在下载… 1M上下文+可用的coding agent能力,全在一台128GB MacBook上,这太疯狂了"

打开网易新闻 查看精彩图片

Antirez用了三个黑客级操作:

1. 不对称2-bit量化

只对MoE里占90%体积的专家部分做2-bit压缩,关键路径保持全精度。质量损失极小,coding agent工作良好。

2. KV Cache扔到SSD

1M上下文会炸掉128GB内存?他直接把KV Cache搬到苹果高速SSD上,用磁盘当扩展内存。

3. 纯Metal原生优化

没有任何多余封装,没有通用框架开销,所有代码只为Apple Silicon写,只为DeepSeek V4 Flash写。

实测性能:M3 Max 128GB上稳定27 tok/s。不算快,但对本地跑agent循环完全够用。

这意味着什么?你不用给OpenAI付API费,不用担心数据泄露,不用忍受网络延迟。所有AI能力,完全在你自己的电脑里。

大厂烧几十亿训练出来的模型,权重一开源,全世界的黑客就会用你想象不到的方式,把它优化到每一个能跑的设备上。

今天是MacBook,明天是手机,后天是手表。

2026年5月9日,AI终于从云端的神坛,落到了每个人的笔记本里。