3年技术债一夜还清：eBPF把AI Agent黑盒拆成了玻璃房

全栈遛狗员

2026-03-31 10:07 ·北京

做产品的都懂，最怕用户反馈"功能坏了"，但查半天不知道哪环出的问题。AI Agent现在就是这个处境——LLM说"我要查天气"，Agent框架翻译成API调用，沙箱启动容器，最后系统执行curl命令。四层接力，但现有的监控工具各看各的：APM只看HTTP状态码，K8s只看Pod起没起，日志只记录文本片段。没人能回答那个灵魂问题：它到底想干嘛？干了没？干成什么样？

阶跃星辰的李昌昊在QCon北京准备讲一套解法：用eBPF把四层串成一根绳。这东西工作在内核层，像X光一样穿透所有容器沙箱，不需要Agent改代码，不需要沙箱预装任何组件。

具体怎么玩？四层各打各的靶。LLM层解密TLS流量，还原每次对话的Token消耗和延迟；Agent层自动识别工具调用拓扑；沙箱平台层把K8s审计日志和运行时事件按时间戳绑定；运行时层捕获每个命令的输入输出、退出码、CPU内存消耗。最后全塞进OTLP标准协议，Jaeger、Grafana直接能接。

最狠的是给RL训练喂数据。以前强化学习 reward 设计靠猜，现在exit_code当Outcome、cpu_time当Efficiency、stdout和退出码的矛盾当Behavior证据——全是从内核里捞出来的硬指标。

当然，坑也有。内核5.x以下基本告别，部分云厂商定制内核缺BTF信息；内核态只能看到syscall，应用内部推理逻辑还得另想办法。但相比让几百个沙箱镜像各装一套SDK，这算是"最不坏"的方案。

李昌昊之前是字节安全风控的，Elkeid和vArmor的核心开发者。这次QCon北京4月16-18日，除了Agent可观测，还有Agentic Engineering、具身智能、算力优化等20多个专题。100多个落地案例，票价9折最后一周——不过对多数人来说，先把这个"四层串联"的思路吃透，可能比买票更急。

有个细节挺有意思：他们内部测试时，靠这套体系抓到一个Agent"嘴上说执行成功，实际exit_code非零"的case——模型幻觉到了系统调用层，原来真能逮住。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴