当整个行业都在追逐Agent能力突破时,一个更危险的问题已悄然出现——你部署的Agent,此刻到底在做什么?
据新智元报道,清华大学人工智能学院、交叉信息研究院的方寸跃迁团队提出一套面向Agent运行全生命周期的多层安全体系,直指当前Agent安全领域一个被长期忽略的根本性盲区。
过去两年,行业几乎把全部火力砸在了模型能力、Agent框架与工具调用体系的军备竞赛里。安全能力更多停留在表层:提示词规则、输入输出过滤、日志审计,加上SDK Hook框架级约束。
但事情并没有这么简单。
这些机制共享一个弱点——它们看到的,只是Agent“声明”出来的行为。执行任务时,Agent会调用API、读写文件、操控浏览器、驱动数据库、与其他Agent协同通信。一个完整任务可能横跨数十个步骤、多个工具链,传统防护手段无法穿透这一层。
方寸跃迁团队的方案从调用链路层、运行时层和生态层三个维度发力。在调用链路层,在工具调用起点建立安全锚点,从源头识别异常。在运行时层,Agent对环境的每次变更都被完整记录并与预期执行计划实时比对,偏离行为边界时立即触发阻断。当Agent进入多智能体协同场景,问题还会上升一个维度:一个Agent向另一个发出的子任务指令可能携带被注入的恶意意图。新方案在生态层建立了跨Agent的安全通信协议与可信传递机制。该方案已与主流Agent框架完成适配对接。
在行业层面,Agent安全正从边缘议题走向中心。中国科学院的ScienceClaw超级智能体同样将全链路沙箱安全作为核心能力。白宫国家经济委员会主任凯文·哈塞特近日公开表示,白宫正研究为AI模型建立审查机制。
据华福证券研报数据,Agent功能已覆盖幻灯片制作、电子表格分析、会议纪要生成等核心办公场景,对金融、医疗、工业控制等领域的渗透正在加速。
Agent从“会聊天的工具”变成“能执行的系统”,安全的游戏规则已经变了。
市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:听潮
热门跟贴