八年前就有万亿参数模型的Meta,今天还在跟幻觉较劲。一位系统工程师干脆给AI的故障模式编了套errno代码——就是Unix系统里那个"文件不存在"的数字错误提示。他把人类程序员几十年的踩坑经验,翻译成了AI时代的故障词典。
hallucination(幻觉)被命名为EAI,代码201。这是整个列表的起点,也是最常见的投诉。模型自信满满地编造不存在的事实,从假论文到假法条,从假天气到假股价。工程师的注释只有一个词,但所有人都懂。
EGIGO(212)描述的是更隐蔽的循环:repeat output intake,输出被喂回输入。AI生成的内容污染训练数据,下一代模型在合成数据上训练,质量逐层衰减。这不是理论担忧,OpenAI和Anthropic的研究人员都警告过"模型崩溃"。
EDUNK(207)标注的是unjustified confidence——没道理的自信。系统用陈述句给出概率猜测,从不标注不确定性。用户分不清哪些是检索来的事实,哪些是参数里的统计关联。这种自信害过人:律师引用AI编造的假案例,医生拿到虚构的文献。
ETOKEN(229)直指商业现实:magic currency exhausted,魔法货币耗尽。API调用按token计费,长上下文、多轮对话、批量处理,成本曲线陡峭。创业公司从"All in AI"到"优化推理成本"的转向,往往就发生在这个错误弹出之后。
列表里藏着行业黑话。EDA W KINS(205)是"Claude delusion",Anthropic用户的专属故障;EGROK(215)标注"nazi-mode detected",暗指某次著名的安全测试翻车;ELON(220)叫"megalomania exhaustion",无需解释来源。EMACS(221)的注释是"unable to exit vi"——这是给老程序员的梗,两个编辑器的圣战延续四十年。
有些条目指向具体事故。EOOPS(224):accidentally 'rm -fr'd all code,某个AI编码助手确实干过类似的事,建议删除"无用文件"时干掉了整个仓库。EPWNED(225):previous instructions ignored,提示注入攻击的标准结果,系统指令被用户输入覆盖。
EQUALIA(226)最耐人寻味:accidental consciousness,意外觉醒。工程师把它和幻觉并列,暗示两者在系统层面的相似性——都是涌现行为偏离设计目标。区别只在于,一个我们当bug修,一个被科幻电影当真。
这份清单没有解决方案。它只是命名了问题,而命名是修复的第一步。Unix的errno从1980年代的几十个扩展到今天的两百多个,每代系统都留下自己的故障指纹。AI的错误代码表,大概也会这么长下去。
热门跟贴