在遭遇外界批评后,人工智能公司安思罗比克表示,今后如果因国家安全考量而拒绝用户请求或将其降级,系统将明确告知用户。在悄然下调部分请求所调用模型能力、引发争议后,安思罗比克正在调整做法。

打开网易新闻 查看精彩图片

这家估值9650亿美元的公司于周二发布了其能力最强模型“神话”系列中的一个版本。安思罗比克今年4月公布“神话”时曾表示,之所以暂未向公众开放该级别模型,部分原因是公司认为它极其擅长绕过网络安全防御,危险性过高,不宜发布。

不过,本周该公司还是决定推出“神话”级模型“寓言5”。安思罗比克称,这一模型的能力“超过我们此前所有已普遍开放的模型”。安思罗比克产品管理、研究与实验室负责人黛安娜·彭此前对《财富》表示,公司之所以愿意发布“寓言5”,是因为“对现有安全护栏更有信心”。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

到了周三,安思罗比克的批评者至少得到了他们所要求的一部分结果:可见性。安思罗比克一名发言人在向《财富》提供的声明中说:“我们正在调整‘言5’针对前沿大语言模型开发的安全护栏,让它们变得可见。从本周开始,被标记的请求将明确回退到Opus 4.8。在API中,任何被标记的请求都会返回被拒绝的原因。每次发生这种情况,用户都能看到。”

打开网易新闻 查看精彩图片

该公司仍将继续下调部分请求所调用的模型能力,部分原因是其服务条款禁止用户利用其模型创建竞争性人工智能系统。安思罗比克表示,这类限制在整个行业都很常见。

不过,该公司也表示,其大语言模型对某些请求进行降级或拒绝,部分原因还涉及国家安全。公司称,它不希望外国对手提升人工智能能力,从而损害美国利益。这名发言人说:“美国及其盟友在前沿芯片以及让这些芯片发挥全部潜力的高度优化软件方面占有优势。这些安全护栏是为了确保Claude不会被用来削弱这种优势,例如被用于优化那些对手开发的芯片。”

打开网易新闻 查看精彩图片

公司还强调,这些限制“不会影响绝大多数编程和机器学习工作”。安思罗比克围绕“寓言5”的调整,也显示出人工智能安全措施正迅速成为国家安全讨论的一部分。今年早些时候,安思罗比克曾因拒绝向战争部提供Claude模型的完全访问权限,与其发生对峙。

最终,战争部将安思罗比克列为对国家安全构成“供应链风险”的企业,限制国防承包商和军方机构使用其产品。本月早些时候,战争部长皮特·赫格塞思驳回了安思罗比克要求更改这一认定的请愿,为一场尚未解决的联邦法院诉讼埋下伏笔。

打开网易新闻 查看精彩图片

安思罗比克在“寓言5”上的做法调整,也发生在该公司本月早些时候秘密提交首次公开募股申请之后。长期以来,这家公司在公开形象上一直强调自己是一家将安全置于首位的人工智能实验室,但它最初选择隐瞒安全护栏何时生效,显然触动了人工智能研究界的敏感神经。公司在声明中承认,自己在这个问题上的处理失当。

安思罗比克发言人说:“我们作出了错误的权衡,对未能把握好平衡表示歉意。”