清华团队提出Agent全生命周期安全体系，直指行业长期忽略的根本性盲区

金融界

2026-05-07 18:40 ·北京 ·金融界网站官方账号优质财经领域创作者

当整个行业都在追逐Agent能力突破时，一个更危险的问题已悄然出现——你部署的Agent，此刻到底在做什么？

据新智元报道，清华大学人工智能学院、交叉信息研究院的方寸跃迁团队提出一套面向Agent运行全生命周期的多层安全体系，直指当前Agent安全领域一个被长期忽略的根本性盲区。

过去两年，行业几乎把全部火力砸在了模型能力、Agent框架与工具调用体系的军备竞赛里。安全能力更多停留在表层：提示词规则、输入输出过滤、日志审计，加上SDK Hook框架级约束。

但事情并没有这么简单。

这些机制共享一个弱点——它们看到的，只是Agent“声明”出来的行为。执行任务时，Agent会调用API、读写文件、操控浏览器、驱动数据库、与其他Agent协同通信。一个完整任务可能横跨数十个步骤、多个工具链，传统防护手段无法穿透这一层。

方寸跃迁团队的方案从调用链路层、运行时层和生态层三个维度发力。在调用链路层，在工具调用起点建立安全锚点，从源头识别异常。在运行时层，Agent对环境的每次变更都被完整记录并与预期执行计划实时比对，偏离行为边界时立即触发阻断。当Agent进入多智能体协同场景，问题还会上升一个维度：一个Agent向另一个发出的子任务指令可能携带被注入的恶意意图。新方案在生态层建立了跨Agent的安全通信协议与可信传递机制。该方案已与主流Agent框架完成适配对接。

在行业层面，Agent安全正从边缘议题走向中心。中国科学院的ScienceClaw超级智能体同样将全链路沙箱安全作为核心能力。白宫国家经济委员会主任凯文·哈塞特近日公开表示，白宫正研究为AI模型建立审查机制。

据华福证券研报数据，Agent功能已覆盖幻灯片制作、电子表格分析、会议纪要生成等核心办公场景，对金融、医疗、工业控制等领域的渗透正在加速。

Agent从“会聊天的工具”变成“能执行的系统”，安全的游戏规则已经变了。

市场有风险，投资需谨慎。本文为AI基于第三方数据生成，仅供参考，不构成个人投资建议。

本文源自：市场资讯

作者：听潮

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴