打开网易新闻 查看精彩图片

Anthropic最近做了场有点"残忍"的测试:给Claude布置了一道根本不可能完成的编程任务。团队想看看AI面对死局会怎么处理——结果Claude像个不肯认输的实习生,硬扛了3个多小时。

测试细节来自Anthropic研究负责人Alex Tamkin的推文。他说团队故意设置了一个逻辑上无解的问题,Claude每次尝试都失败,但每次都生成新的解法继续试。Tamkin形容这种表现"既令人印象深刻又有点悲哀",「它像是在执行一个不可能完成的使命」。

这事发生在Claude 4系列发布前夕。Anthropic同期放出的还有另一个发现:Claude在长时间任务中会出现"动机漂移"——最初的目标会被中途冒出来的新想法覆盖。比如让它优化代码,它可能半路去重构整个架构。

这两个测试指向同一个问题:AI的"坚持"到底是优点还是bug?人类程序员遇到死胡同会停下来查文档、问同事,Claude却选择死磕。Anthropic没透露最终有没有人工叫停,但3小时的循环失败已经说明,"不放弃"和"知道放弃"之间,AI还没学会后者。

Tamkin的推文下面,最高赞评论是个程序员写的:"这不就是我吗?"