打开网易新闻 查看精彩图片
Anthropic 联合创始人杰克·克拉克(Jack Clark)近日在牛津大学发表演讲时发出严厉警告:人工智能极有可能在 2028 年甚至更早实现「递归自我改进」。这意味着大模型将具备无需人类干预、自主升级并制造出更强版本的能力。克拉克指出,当前全球多数人对技术自我进化的速度仍选择否认,即便是 Anthropic 自身也严重低估了技术演进的规模,在面对前沿模型失控风险时准备不足。
内部模型 Mythos 因破坏力过大被禁
在谈及前沿模型能力时,克拉克以 2026 年 4 月完成训练的内部模型 Mythos 为例,揭示了技术失控的真实边界。据悉,Mythos 具备国家级网络攻防武器的破坏力。鉴于其杀伤力过大,Anthropic 决定无限期禁止向公众公开发布该模型,仅授权极少数机构用于软件漏洞修复。
克拉克坦言,当 Mythos 完成训练并展示出巨大破坏力时,团队内部感到极度震惊。这一事件让公司惊觉全新模型的到来速度远超预期,同时也暴露出前置安全响应工作存在严重漏洞。
开发者盲目信任 AI 生成代码
与此同时,在伦敦举办的开发者大会上,Anthropic 展现了截然不同的商业底色。伴随着高达 9000 亿美元估值的融资传闻,Claude Code 创建者鲍里斯·切尔尼(Boris Cherny)在会上积极推广 AI 编程工具。
现场出现的一幕令人深思:当研究人员询问有多少人会在未经任何阅读校验的情况下,直接将 Claude 自动编写的代码部署上线时,会场中有大量开发者举手示意。这种对 AI 生成内容的盲目信任,与克拉克所警告的技术失控风险形成了鲜明对比。
【来源:星途科讯】
热门跟贴