打开网易新闻 查看精彩图片
DeepMind和斯坦福去年联手搞了个ChemBERTa-2,号称化学界的"基础模型",参数堆到2.7亿。结果一群化学家最近把它拉出来测了测,发现这玩意儿连最基本的分子结构都搞不定。
打开网易新闻 查看精彩图片
测试方法很直接:让模型预测分子性质、生成有效结构。按理说这种任务对AI应该像小学算术,但ChemBERTa-2在标准基准测试里被自家前代版本ChemBERTa-1吊打。更尴尬的是,它生成的分子里有相当一部分根本不存在——键连错了,环结构违反了化学定律,相当于画了个方轮子还坚称能跑。
打开网易新闻 查看精彩图片
论文作者之一在报告里写了句实话:「我们发现更大的模型并没有带来更好的化学理解。」换句话说,堆参数这套在化学领域突然失灵了。团队原本期待能像NLP那样搞出涌现能力,结果等来的却是涌现幻觉。
这事给AI for Science敲了记闷棍。化学不像语言,有严格的物理定律管着,不是靠海量文本喂出来的统计规律能糊弄过去的。目前该模型仍在Hugging Face上挂着下载,但论文团队已经默默把"基础模型"四个字从宣传页删了。
热门跟贴