化学版GPT-3翻车：2.7亿参数模型连分子式都写错

字节漫游指南

2026-03-29 10:46 ·北京

DeepMind和斯坦福去年联手搞了个ChemBERTa-2，号称化学界的"基础模型"，参数堆到2.7亿。结果一群化学家最近把它拉出来测了测，发现这玩意儿连最基本的分子结构都搞不定。

测试方法很直接：让模型预测分子性质、生成有效结构。按理说这种任务对AI应该像小学算术，但ChemBERTa-2在标准基准测试里被自家前代版本ChemBERTa-1吊打。更尴尬的是，它生成的分子里有相当一部分根本不存在——键连错了，环结构违反了化学定律，相当于画了个方轮子还坚称能跑。

论文作者之一在报告里写了句实话：「我们发现更大的模型并没有带来更好的化学理解。」换句话说，堆参数这套在化学领域突然失灵了。团队原本期待能像NLP那样搞出涌现能力，结果等来的却是涌现幻觉。

这事给AI for Science敲了记闷棍。化学不像语言，有严格的物理定律管着，不是靠海量文本喂出来的统计规律能糊弄过去的。目前该模型仍在Hugging Face上挂着下载，但论文团队已经默默把"基础模型"四个字从宣传页删了。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴