2024年,硅谷有47个项目自称在做"Agent操作系统"。其中46个的代码结构长这样:一个kernel/文件夹,一个memory/文件夹,一个scheduler/文件夹。打开一看,是个人助理的聊天界面。
把文件夹命名改成Unix风格,不等于你真的在做操作系统。
01 为什么"Agent OS"成了热词
这个词的吸引力太直接了。操作系统是计算机的底层,谁拿下这个名字,谁就能在叙事上压对手一头。OpenAI、Anthropic、Google,每家都在不同场合暗示过自己的模型是"新一代OS"。
但喊口号和建地基是两回事。真正的操作系统要解决四个问题:资源怎么跨机器分配、身份怎么验证、故障怎么隔离、进程怎么通信。个人助理一个用户一台机器,这四个问题它一个都不碰。
举个例子:你的AI助理记住了你的偏好,这叫"状态"。但真正的OS要问的是——这个状态存在哪台服务器?如果那台机器宕了,怎么恢复?另一个用户的Agent能不能读取?怎么防止它读取?
02 个人助理 vs 操作系统:边界在哪
现在的"Agent OS"项目,核心架构是单租户(single-tenant)。一个用户,一个Agent实例,一个数据库行。这和企业级操作系统之间的差距,相当于单机版Excel和Google Sheets的区别。
真正的操作系统必须处理多租户(multi-tenancy)。同一台物理机上跑着互不认识的用户的Agent,它们要共享CPU、内存、网络,但不能互相偷看数据。一个Agent崩溃了,不能拖垮整台机器。
还要解决调度问题。不是"早上9点提醒我开会"这种调度,是"100万个Agent同时在跑,怎么决定哪个先用GPU"的调度。这需要优先级队列、资源配额、抢占机制——和Linux内核里的cgroups、namespaces一个级别的东西。
大多数项目停在隐喻层:代码目录结构像OS,实际能力像App。
03 什么才算"Agent原生"的基础设施
作者团队给出的定义很具体:Agent OS必须提供四类原语(primitives)。
第一类是身份(Identity)。不是登录账号那种身份,是密码学可验证的身份。Agent A向Agent B发请求,B能确认"这确实是A,不是冒充的",而且不需要问中央服务器。这靠的是分布式身份协议,类似W3C的DID标准。
第二类是隔离(Isolation)。Agent的代码可能来自任何人,可能包含bug或恶意逻辑。OS要在沙箱里运行它,限制它能调用的API、能访问的数据、能消耗的算力。这和浏览器跑JavaScript用的V8隔离机制同源,但粒度更细。
第三类是调度(Scheduling)。Agent不是持续运行的进程,是事件驱动的——收到消息才唤醒,处理完就休眠。OS要管理这种"间歇性活跃"的百万级实例,比传统操作系统的进程调度复杂一个数量级。
第四类是通信(Communication)。Agent之间需要发现彼此、建立连接、协商协议。这不能靠硬编码的API端点,需要类似服务网格(service mesh)的动态路由,但又要保持端到端加密。
04 他们实际建了什么
作者团队的产品叫Daydreams。架构上做了几个关键选择:
运行时是WebAssembly(Wasm)。每个Agent编译成Wasm模块,加载时动态注入能力(能访问哪些API、能连接哪些数据源)。这比容器启动快100倍,内存占用低两个数量级,适合"随时唤醒、快速执行、立即休眠"的Agent工作负载。
状态管理用CRDT(无冲突复制数据类型)。Agent的状态不是存在某个数据库里,是分散在多个节点上的副本,自动合并冲突。这意味着Agent可以从任意节点恢复,不依赖单点存储。
通信层基于gossip协议。Agent发现彼此不靠中央注册表,是靠节点之间互相传播"我知道谁在线"的信息。这和比特币网络、IPFS的节点发现机制类似,抗单点故障。
技术选型透露了一个判断:Agent基础设施必须是去中心化的,因为任何中心化组件都会成为瓶颈或攻击目标。
05 这个赛道谁会活下来
2024年的"Agent OS"混战,和2000年的"应用服务器"市场很像。当时BEA WebLogic、IBM WebSphere、JBoss都在喊自己是"企业级基础设施",最后活下来的是真正把分布式事务、集群管理、热部署做扎实的选手。
现在的信号是:能演示漂亮聊天界面的团队很多,能公开讨论"我们的调度器怎么处理优先级反转"的团队很少。后者才是建地基的人。
Daydreams团队开源了核心运行时。GitHub上有个issue列表,第17条是用户反馈:"我的Agent在节点A启动,在节点B恢复后,时区配置丢了。"维护者的回复是:"CRDT合并时把本地环境变量覆盖了,下个版本修复。"
这种对话不会出现在产品发布会上,但它告诉你——有人在真刀真枪地解决Agent跨机器运行的脏问题。
当行业还在争论"Agent OS"的定义权时,真正在写调度器代码的人,可能根本不在乎这个标签。他们只关心一个问题:你的Agent,能不能在我不认识的机器上可靠地跑起来?
热门跟贴