打开网易新闻 查看精彩图片

Agent能自己干活之后,安全问题就不再是"修个bug"那么简单了。它像个刚拿到驾照就敢上高速的新手司机——能力有了,但边界感还没长全。

4月16日到18日,QCon全球软件开发大会北京站专门开了个专题《智能体安全实践:可控与可靠》,蚂蚁集团副总裁韦韬博士坐镇出品人。这位一手搞出"隐语""星绽"等开源安全项目的老兵,显然是想把智能体的缰绳提前拴好。

韦韬的履历足够硬:近百篇论文、5700+引用、四十多项专利,密态计算和安全平行切面防御体系都是他的手笔。但履历再漂亮,也抵不过一个现实问题——当Agent开始跨App、跨设备替你办事,怎么保证它不会"好心办坏事"甚至"故意办坏事"?

打开网易新闻 查看精彩图片

支付宝给出的答案是AHA(Agent Hub Access)。这个方案想让手机、车机、眼镜上的智能体互相串门,实现"所想即所得"。听起来很美好,但生态越开放,攻击面就越像一张摊开的地图。陈文波(闻计)会讲讲他们怎么用纵深防御体系给AHA打底,重点盯防协议、应用和数据隐私三条线。

vivo的张栋则把问题拆得更细。他们建了套覆盖6大领域、103项风险的治理框架,还养了支Red Team专门"找茬"。基于"思维偏误理论"的攻击探索、针对Deep Research和Code Agent的实战攻防——这些听起来像谍战片的情节,其实是端侧AI的日常。

清华邱寒博士的视角更偏学术:智能体安全的评测怎么做?黑盒行为怎么解释?风险怎么防?OpenClaw这类能直接碰你邮件和日程的Agent火了,但安全要是跟不上,火得越快,凉得越早。

打开网易新闻 查看精彩图片

京东Sunny Duan的分享最"工程"。他们把Agent安全拆成五层攻击面,搞了个JoySafety框架和JoySafeter平台,输入防火墙、Skills沙箱、执行链管控、可观测审计——层层设卡,试图把风险拦在发生之前。

四家公司,四种打法,但共识很明显:传统那套"设计-开发-测试-上线"的安全流程,对Agent这种会自己变招的对手已经不够用了。安全边界必须前移,可靠性不是加分项,是入场券。

韦韬在蚂蚁内部推动安全平行切面时说过一句话:安全能力要像血管一样嵌入业务,而不是像膏药一样贴上去。现在这套逻辑,正在被复制到智能体身上。