导语
人工智能(AI)的发展加速了科学发现。伴随着近期授予 AI 相关研究的诺贝尔奖,这些趋势确立了 AI 工具在科学中的作用。这一进步引发了关于 AI 工具对科学家及科学整体影响的疑问,并凸显了个人利益与集体利益之间潜在的冲突。
为了评估这些问题,近日,清华大学电子工程系李勇教授团队发表于 nature 的文章利用预训练语言模型识别AI赋能的科学研究(AI for Science),发现 AI 工具显著提升了科学家个人的产出和影响力,加速了职业晋升,但同时也导致了科学界整体关注焦点的收缩和多样性的减少。
在文章最后,我们对比了分别发表于 Science(详见集智俱乐部《》)和 Nature 的两项研究。它们并非给出相互对立的判断,而是从科研流程的不同环节切入,揭示了同一场变革的两面性:大语言模型一方面拓宽了科学家的阅读与连接范围,另一方面却可能收紧科学发现的实际路径。合在一起,这些发现共同勾勒出一个耐人寻味的图景——科学家读得更广,却做得更窄。
关键词:人工智能,科学计量学,科研生产力,马太效应
任筱芃丨作者
赵思怡丨审校
论文题目:Artificial intelligence tools expand scientists’ impact but contract science’s focus 论文链接:https://doi.org/10.1038/s41586-025-09922-y 发表时间:2026年1月14日 论文来源:nature
研究背景与问题
AI 作为“双刃剑”
AI 已深度融入知识生产过程,如 AlphaFold 预测蛋白质结构等突破性成果展示了其巨大潜力。然而,AI 工具对科学家和科学整体特征的影响尚不完全清楚。尽管现有研究表明 AI 为科学家带来了个人利益,但也引发了对科学领域马太效应和引用模式变化的担忧。
核心研究问题
该研究基于 OpenAlex 数据库中 1980 年至 2025 年间的 4130 万篇 自然科学论文(涵盖生物学、化学、物理学等六大基础学科),利用微调的 BERT 模型识别 AI 辅助的研究,旨在回答以下问题:
个体生产力:采用 AI 工具如何影响科学家的产出、引用和职业生涯?
集体生产关系:AI 的广泛应用是否改变了科学探索的广度和多样性?
机制探究:这种新的个体与集体之间的张力是如何产生的?
主要研究发现
个体层面的“buff”
图1:AI 扩大了论文影响力并促进了研究人员的职业生涯。a, AI 论文(红色)与非 AI 论文(蓝色)发表后的平均年引用次数(插图显示了前 1% 和前 10% 的情况;样本量 n = 27,405,011),结果显示 AI 论文吸引了更多引用。b, 使用 AI 的研究人员与未使用 AI 的同行(对照组)的平均年引用次数(P < 0.001,样本量 n = 5,377,346),其中采用 AI 的研究人员获得的引用次数是未采用者的 4.84 倍。c, 采用 AI 的初级科学家与未采用 AI 的同行之间两种角色转变的概率(每个领域 n = 46 年的观测值)。与未采用 AI 的同行相比,采用 AI 的初级科学家成为知名研究者(established researchers,即项目负责人)的概率更高,而退出学术界的概率更低。d, 从初级科学家向既定研究者转变的生存函数(P < 0.001,样本量 n = 2,282,029)。生存函数可以很好地用指数分布拟合,结果表明采用 AI 的初级科学家更早成为既定研究者。对于所有面板,99% 置信区间(CIs)均以误差条形式显示,其中图 a 的插图以 1% 和 10% 分位数为中心,其他子图以均值为中心。所有统计检验均使用双侧 t 检验
从事 AI 增强研究的科学家,其发表论文数量是未使用 AI 同行的 3.02 倍,获得的引用次数更是高达 4.84 倍。这种优势在控制了早期职业地位后依然存在,表明 AI 本身就是造成差异的重要因素。
AI 的使用加速了初级科学家向既定研究者(项目负责人)的转变。采用 AI 的初级科学家成为项目负责人的时间比同行平均缩短了 1.37 年,且不仅增加了晋升概率(高出 13.64%),还降低了退出学术界的风险。
图2: AI 研究与研究团队规模的缩小有关,平均减少了 1.33 名科学家(P < 0.001,样本量 n = 33,528,469)。具体而言,初级科学家(junior scientists)的平均数量从非 AI 团队的 2.89 人减少至 AI 团队的 1.99 人(降幅 31.14%),而既定科学家(established scientists)的数量从 4.01 人减少至 3.58 人(降幅 10.77%)。
需要注意的是 AI 辅助的研究团队规模通常更小,平均减少了 1.33 名成员,且主要减少的是初级科学家。这暗示 AI 可能正在替代部分初级研究人员的数据处理和模式识别工作。
集体层面的收缩视野
然而,个体层面的繁荣背后,隐藏着科学探索整体视野的狭窄化。
研究引入了“知识广度”(Knowledge Extent)这一指标,即论文集合在向量空间覆盖的“直径”。结果显示,与传统研究相比,AI 驱动的研究在所有学科中都导致了集体知识广度的收缩,中位数下降了 4.63%。
AI 研究的知识分布熵值更低,表明研究焦点日益不成比例地集中在特定领域的现有热门问题上,而非探索新的领域。
图3:AI 的采用与科学领域内外知识程度的收缩有关。a,研究团队使用预训练的文本嵌入模型将研究论文嵌入 768 维向量空间;然后测量该空间内论文的知识程度。b,为了可视化,研究团队使用 t 分布随机邻域嵌入 (t-SNE) 算法将随机批次 10,000 篇论文 (其中一半是 AI 论文) 的高维嵌入平铺到二维图中。如实心箭头和圆形边界所示,在整个自然科学领域,AI 论文的知识程度 (在未平铺的空间中计算) 较小。此外,AI 论文在知识空间中更加集中,表明对特定问题的关注更加集中。c,每个领域中 AI 和非 AI 论文的知识程度 (P<0.001,每个领域中 n = 1,000 个样本),其中 AI 研究侧重于更加收缩的知识空间。d,每个领域人工智能和非人工智能论文的知识熵 (P<0.001,每个领域 n = 1,000 个样本),其中人工智能研究的熵较低。对于面板 c 和 d,方框图以中位数为中心,以第一和第三四分位数 (Q1 和 Q3) 为界。所有统计检验都使用中位数检验。
如图 3 所示,在嵌入向量空间的可视化中,AI 论文(红色点)相比非 AI 论文(蓝色点)在知识空间上的分布更为聚集,覆盖范围更小。这意味着 AI 正引导科学界在“已知”的数据丰富区域深耕,而非向“未知”的边缘拓展。
互动的减少与焦点的固化
为何 AI 会导致科学关注点的收缩?研究揭示了深层的互动机制变化。
研究分析了引用同一篇 AI 论文的后续论文之间的关系,发现它们彼此引用的频率比非 AI 领域低了22%。这表明 AI 研究往往形成围绕特定热门成果的“星状结构”,而非相互交织的“网络结构”。AI 论文引发的后续研究更像是“孤独的群体”,彼此缺乏对话。
图4:AI 与非 AI 论文的引用分布情况。AI 论文往往更多地集中在少数顶尖论文上(P < 0.001,n = 100 个采样论文组),表现出更强的马太效应。
AI 领域的引用分布极不均衡。前22.20%的顶尖论文占据了80%的引用量,其基尼系数(0.754)显著高于非 AI 论文(0.690)。这种符合“二八定律”的局面进一步强化了对少数热门主题的关注。
分析显示,数据可用性是 AI 选题的主要驱动因素。AI 倾向于涌向那些数据最丰富的领域,从而导致知识空间的集中,而那些缺乏数据的基础性或新兴问题则可能被边缘化。
讨论与启示
这项研究揭示了一个加速后的两难。AI 既是科学家个人成功的加速器,也可能是科学集体探索的减速带。
科学家为了追求更高的产出和影响力,有强烈的动力采用 AI。然而,这种微观上的理性选择,在宏观上却导致了科学界扎堆解决已知问题,甚至是在重复性地优化现有方案,而非开辟新天地。
这一发现对科学政策提出了挑战。仅仅增加对 AI 科研的资助可能会加剧“富数据”领域的拥挤,而忽视那些数据稀缺但至关重要的基础问题。
为了保持科学探索的多样性,至少未来的 AI 系统不应仅局限于认知能力的增强(如数据分析),更需要扩展“感知和实验”能力(Sensory and experimental capacity)。我们需要能帮助科学家收集新数据、探索未知领域的 AI,而不仅仅是处理现有数据的 AI。
该研究的局限性
研究团队指出了本工作的几个局限性,需要予以考量:
识别方法的局限:使用的 BERT 模型虽然经过专家验证,但可能遗漏了一些微妙或未在摘要中明确提及的 AI 使用情况
样本范围:研究聚焦于自然科学,排除了计算机科学和数学(AI 方法的诞生地),也未包含社会科学等领域,这可能限制了结论的普适性。
因果关系的复杂性:尽管使用了对照分析,但难以完全确定 AI 采用与科学影响之间的严格因果链条,且目前主要反映的是基于数据处理和模式识别的 AI 应用(如机器学习、深度学习),对新式 AI 的长期影响分析显然处于初步阶段
AI 正在以前所未有的速度重塑科学界。它让科学家跑得更快,但也可能让我们跑在同一条拥挤的跑道上。如何在利用 AI 提升效率的同时保持科学探索的广度与好奇心,是该团队认为的未来科学发展的关键命题。
AI 黑箱或许在促进个体的认知扩张的同时
也导致了集体的行动收缩
结合集智俱乐部昨日解读Science 论文 (Kusumegi et al., 2025,详情请见《》),我们会发现我们似乎面临一个悖论:
• Science:LLM 让科学家引用了更多跨学科、跨文化、更老或更新的文献,似乎拓宽了视野。
• nature:AI 工具(主要是 ML/DL)导致科学探索的视野收缩。
这并非立场的冲突,而是通过不同的切面拼凑出了完整的科研图景——现在我们读得更广,做得更窄。
LLM 作为辅助工具,确实帮助我们跨越了语言和阅读障碍,让我们能“看到”——至于人是否真的看了我们无从得知——更多的东西。但是,当涉及到核心的科学发现环节时,算法的本质鼓励了我们只能去那些有数据富集的领域,导致我们的原型(archetype)选择变得拥挤和趋同。
对于黑箱以外的观察是信息摄入(Input)变宽了,但我们的知识生产(Output)变窄了。所以现在的局面就变成了一种很微妙的反向约束。AI 在阅读端帮我们打破了壁垒;但在生产端,其“数据饥渴”的属性又把我们按回了那些最拥挤的熟地里。这里有一个案例:MOSAIC(Multiple Optimized Specialists for AI-assisted Chemical Prediction)基于 Llama-3.1-8B-instruct 架构构建,通过在 Voronoi 聚类空间中训练 2498 个专业化学专家模型,为复杂合成提供具有置信度指标的可复现、可执行的实验方案。(Li et al., 2026, p. 1) 然而,MOSAIC 的运作机制也恰恰印证了 Nature 论文所指出的隐忧。MOSAIC 之所以强大,是因为有数百万反应方案的既有数据供其挖掘。这种基于海量历史数据训练出来的专家混合模型,本质上是在“自动化既有领域(automate established fields)”(Hao et al., 2026),在已知的数据空间里进行极致的优化和预测。
与其说是 AI 限制了我们,不如说是我们为了追求发表效率,主动选择了去摘那些 AI 够得着的低垂果实,即使是以一种极其繁复的手段。结果就是大家方法越来越花哨,做出来的东西却越来越像。未来的挑战之一可能不在于怎么用 AI 分析数据,而在于怎么用 AI 去那些没有数据的地方“感知”出新数据来。
论文作者:
参考文献
Hao, Q., Xu, F., Li, Y., & Evans, J. (2026). Artificial intelligence tools expand scientists’ impact but contract science’s focus. Nature. https://doi.org/10.1038/s41586-025-09922-y
Kusumegi, K., Yang, X., Ginsparg, P., de Vaan, M., Stuart, T., & Yin, Y. (2025). Scientific production in the era of large language models. Science, 390(6779), 1240–1243. https://doi.org/10.1126/science.adw3000
Li, H., Sarkar, S., Lu, W., Loftus, P. O., Qiu, T., Shee, Y., Cuomo, A. E., Webster, J.-P., Kelly, H. R., Manee, V., Sreekumar, S., Buono, F. G., Crabtree, R. H., Newhouse, T. R., & Batista, V. S. (2026). Collective intelligence for AI-assisted chemical synthesis. Nature, 1–3. https://doi.org/10.1038/s41586-026-10131-4
AI+Science 读书会
AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。 一方面是 AI for Science,机器学习和其他 AI 技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的“第五范式”。 另一方面是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。
集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以”为主题的读书会,探讨该领域的重要问题,共学共研相关文献。 读书会已完结,现在报名可加入社群并解锁回放视频权限。
详情请见:
1.
2.
3.
4.
5.
6.
7.
热门跟贴