打开网易新闻 查看精彩图片

去年那场30天绝食没能让Anthropic停下Claude的开发,上周末,同一批人换了种方式回来——近200名抗议者把公司总部围了,要求CEO Dario Amodei公开签字画押:彻底暂停AI研发。

组织方Stop the AI Race的成员构成很有意思:前科技行业员工、研究人员,还有Pause AI、QuitGPT这类草根组织的成员。他们不是反对AI画画写诗,怕的是另一种能力——AI自动化AI研究,也就是自我改进

「实验室CEO自己都说风险真实存在」

「实验室CEO自己都说风险真实存在」

「我们暂停AI的原因是,相信能自动化AI研究、能自我改进的AI可能对人类构成危险,尤其是人类灭绝。」组织者Michaël Trazzi对当地媒体说,「不止我和其他研究人员这么说,实验室CEO们自己也承认风险真实存在。」

这话指向的是Anthropic自己的公开表态。Amodei去年在《纽约时报》的访谈中确实谈过「灾难性风险」的可能性,只是公司层面的应对策略是「边开发边对齐」,而非暂停。

抗议队伍在Anthropic总部集结后,一路 marching 到Sam Altman的OpenAI和Elon Musk的xAI,诉求一致:公开承诺,只要其他家停,自家也停。Trazzi在社交媒体上宣称这是「美国史上最大规模的AI安全抗议」

人群里有个熟面孔——Guido Reichstadter,去年那场30天绝食的主角。绝食第九天,他对Futurism说前沿AI系统是「全新类别的危险」。现在他换了个说法:「这些公司没权利做正在做的事——有意识地危及我的生命、我家人的生命、我们所有人的生命。」

Claude已经在帮美军挑轰炸目标

Claude已经在帮美军挑轰炸目标

抗议者的「人类灭绝」叙事听起来遥远,但有个事实让讨论变得具体:Claude已经在军事场景里落地。今年早些时候,Anthropic与五角大楼达成合作,Claude被用于分析潜在打击目标——包括一次针对也门某地的空袭策划。

更具争议的是后续报道:同一套系统是否参与了加沙地带一所小学的轰炸目标筛选?五角大楼对此拒绝置评。

这让「AI失控」的担忧分裂成两个层面。一层是科幻式的——自我改进的AI突破 containment,人类束手无策;另一层已经发生——在人类手里,AI正在成为杀伤链的一环。Reichstadter说的「危及所有人」,两种解读都成立。

打开网易新闻 查看精彩图片

Stop the AI Race的战术也在进化。绝食是个人苦行,这次转向集体行动;不止盯一家,而是串联Anthropic、OpenAI、xAI三家头部实验室;诉求从「你们停下」变成「互相监督式暂停」——每家都承诺,条件是竞争对手同步。

这是个精巧的设计,也是死结。商业竞争语境下,「别人停我才停」等于没人会先迈步。Trazzi似乎清楚这点,他的真正目标可能是把「暂停承诺」变成公共舆论压力测试:看哪家CEO敢明确说「不签」。

200人 vs 数十亿美元

200人 vs 数十亿美元

Anthropic去年融资额超过70亿美元,OpenAI估值逼近900亿,xAI刚完成60亿新一轮。三家实验室的年研发投入以十亿美元计,背后是微软、亚马逊、马斯克的资本意志。

抗议者的筹码是什么?

历史参照或许有用。2015年,上千名科学家联名呼吁禁止自主武器,联合国随后启动《特定常规武器公约》谈判——至今未达成约束力文件。2023年,图灵奖得主Yoshua Bengio等人签署公开信,呼吁暂停超强AI研发六个月,实际影响有限。

但Trazzi们赌的是另一个变量:自我改进AI的临近。Anthropic的技术路线图里,「自动化AI研究」是明确目标,时间窗口可能在2-5年。如果「美国史上最大规模AI安全抗议」的标签能持续放大,舆论压力可能在某个关键产品发布前形成阻滞。

Reichstadter的30天绝食没等到回应,但留下了身体记忆。这次200人游行,他再次站在队伍里。两个细节值得注意:抗议者选择周末而非工作日,避免与员工直接冲突;路线设计经过三家实验室,制造「行业共犯」的叙事框架。

Anthropic尚未公开回应此次抗议。公司近期的公开动作是发布Claude 3.5系列,强调「安全评估」和「负责任扩展政策」——一种渐进式治理话语,与「暂停」诉求形成鲜明对照。

抗议者的下一步计划未披露。Trazzi的社交媒体停留在「最大规模抗议」的宣告,没有后续行动预告。200人的数字在旧金山湾区科技抗议史上能排第几,或许不如另一个问题紧迫:当AI真的能自我改进时,现在这些争论会不会显得像马车夫讨论汽车限速?

或者反过来——如果自我改进的临界点永远不会到来,这场抗议会被怎样书写?