“法务团队正在评估Anthropic的数据保留要求,未来是否会批准使用仍不确定。”6月11日,一位微软员工向The Verge透露了内部对Claude Fable 5模型的限制原因。2026年6月9日,Anthropic正式推出了备受关注的新一代模型Claude Fable 5,作为此前仅限部分组织使用的Claude Mythos的公开版本。然而,微软内部员工并未像外部客户一样获得立即使用的权限,这家科技巨头正在为员工隐私与AI安全审查机制寻找平衡点。
此次发布的两个模型中,Claude Mythos 5继承了“神话”系列的高阶能力但依然维持严格的安全防护解除状态,仅向特定组织开放;而Claude Fable 5则是在施加安全限制后的产品化版本,面向所有用户。两者均可被视为4月7日亮相的Claude Mythos Preview的正式更新。微软很快将Claude Fable 5接入GitHub Copilot和Foundry平台供外部客户使用,但在内部版本的GitHub Copilot模型选择界面中,这款新模型的身影却刻意缺席。
支持这种做法的一方观点认为,Anthropic设置的数据审查机制是合理的。在发布Claude Fable 5的同时,Anthropic明确表示出于“安全对策”的目的,会保留用户与模型的全部对话记录30天。一旦系统标记出“可能造成重大危害”的情形,或收到客户书面请求,经过授权且数量有限的审查人员就能够访问这些对话内容。这一政策尤其针对Mythos系列模型惊人的能力储备——此前公开信息显示,Claude Mythos Preview可以将已知漏洞从“N-day”推进到“N-hour”,在数小时内打造出攻击工具,安全风险远非普通对话模型可比。
反对的一方则将目光聚焦于企业内部的合规性。微软员工收到的解释是:法务团队正在评估Anthropic的数据保持条款是否符合公司内部的安全与隐私要求。问题的核心在于,即便外部客户可以在知情同意的框架下接受对话可能被回查,企业内部场景却更复杂。员工使用Copilot时可能涉及未公开的代码、战略讨论或敏感业务逻辑,这些信息一旦被第三方平台的审查人员接触,哪怕是在极端安全条件下,也会引发数据泄露和知识产权保护的担忧。Cloudflare此前对Mythos模型开展的安全性验证从侧面印证了模型的高风险属性,也使得这种担忧更有了现实依据。
一位从业人员对这场争议给出了自己的判断:这并非简单的“信不信任模型提供商”的问题,而是一场关于安全审查边界的重新划定。一方面,Claude Mythos Preview时代就已出现的“Project Glasswing”先行计划已在15个以上国家扩展,证明高度受控的访问模式能够兼顾能力释放与风险管控。Anthropic在Claude Fable 5上推行的30天保留加条件审查,可以视作这种管控思路的零售化落地。另一方面,当模型的能力逼近真实世界的攻击开发效率时,任何对话回溯机制都会在企业端触发连锁反应——微软内部动用的评估流程便是例证,而公司拒绝就此事发表评论又给这场争论留下了一段沉默的空白。
这场摩擦并没有否定Claude Fable 5本身的价值,但它把一个问题推到了台前:安全模型的高可用性承诺,必须配套不被企业客户视作威胁的数据治理规则。Anthropic试图通过“有限审查人员+明确触发条件”的设计降低越界风险,但微软员工端的暂停表明,即便是这样有限度的透明,也还没能跨过大型组织内部的合规门槛。来自微软法务的评估结果将成为一个重要的信号——若最终放行,说明业界可以在可接受的隐私成本下容纳更高强度的AI安全审查;若长期搁置,其他企业可能会效仿这种谨慎,反过来影响下一代高性能模型的部署速度。
当AI的破坏力不再是实验室里的假设,对话历史的回查就成了悬在企业头上的一把双刃剑。Claude Fable 5的这段插曲提醒所有人:安全模型的真正落地,比拼的不仅是推理速度和代码能力,还有让使用者敢于毫无保留地输入每一个指令的勇气。
热门跟贴