做产品的都懂,最怕用户反馈"功能坏了",但查半天不知道哪环出的问题。AI Agent现在就是这个处境——LLM说"我要查天气",Agent框架翻译成API调用,沙箱启动容器,最后系统执行curl命令。四层接力,但现有的监控工具各看各的:APM只看HTTP状态码,K8s只看Pod起没起,日志只记录文本片段。没人能回答那个灵魂问题:它到底想干嘛?干了没?干成什么样?

阶跃星辰的李昌昊在QCon北京准备讲一套解法:用eBPF把四层串成一根绳。这东西工作在内核层,像X光一样穿透所有容器沙箱,不需要Agent改代码,不需要沙箱预装任何组件。

打开网易新闻 查看精彩图片

具体怎么玩?四层各打各的靶。LLM层解密TLS流量,还原每次对话的Token消耗和延迟;Agent层自动识别工具调用拓扑;沙箱平台层把K8s审计日志和运行时事件按时间戳绑定;运行时层捕获每个命令的输入输出、退出码、CPU内存消耗。最后全塞进OTLP标准协议,Jaeger、Grafana直接能接。

最狠的是给RL训练喂数据。以前强化学习 reward 设计靠猜,现在exit_code当Outcome、cpu_time当Efficiency、stdout和退出码的矛盾当Behavior证据——全是从内核里捞出来的硬指标。

打开网易新闻 查看精彩图片

当然,坑也有。内核5.x以下基本告别,部分云厂商定制内核缺BTF信息;内核态只能看到syscall,应用内部推理逻辑还得另想办法。但相比让几百个沙箱镜像各装一套SDK,这算是"最不坏"的方案。

李昌昊之前是字节安全风控的,Elkeid和vArmor的核心开发者。这次QCon北京4月16-18日,除了Agent可观测,还有Agentic Engineering、具身智能、算力优化等20多个专题。100多个落地案例,票价9折最后一周——不过对多数人来说,先把这个"四层串联"的思路吃透,可能比买票更急。

有个细节挺有意思:他们内部测试时,靠这套体系抓到一个Agent"嘴上说执行成功,实际exit_code非零"的case——模型幻觉到了系统调用层,原来真能逮住。