Redis创始人Antirez又搞了个大新闻。
这次不是数据库,而是一个叫ds4的开源项目——专门为DeepSeek V4 Flash写的原生推理引擎,只有几千行C代码。
它做到了一件很多人觉得不可能的事:把拥有1M上下文窗口、能跑完整coding agent循环的准前沿模型,完整跑在一台普通的128GB MacBook Pro上。
YC CEO Garry Tan看完直接转发:"正在下载… 1M上下文+可用的coding agent能力,全在一台128GB MacBook上,这太疯狂了"
打开网易新闻 查看精彩图片
Antirez用了三个黑客级操作:
1. 不对称2-bit量化
只对MoE里占90%体积的专家部分做2-bit压缩,关键路径保持全精度。质量损失极小,coding agent工作良好。
2. KV Cache扔到SSD
1M上下文会炸掉128GB内存?他直接把KV Cache搬到苹果高速SSD上,用磁盘当扩展内存。
3. 纯Metal原生优化
没有任何多余封装,没有通用框架开销,所有代码只为Apple Silicon写,只为DeepSeek V4 Flash写。
实测性能:M3 Max 128GB上稳定27 tok/s。不算快,但对本地跑agent循环完全够用。
这意味着什么?你不用给OpenAI付API费,不用担心数据泄露,不用忍受网络延迟。所有AI能力,完全在你自己的电脑里。
大厂烧几十亿训练出来的模型,权重一开源,全世界的黑客就会用你想象不到的方式,把它优化到每一个能跑的设备上。
今天是MacBook,明天是手机,后天是手表。
2026年5月9日,AI终于从云端的神坛,落到了每个人的笔记本里。