作为一线科研工作者,大家都有切身体会:嘴上说着反“五唯”,但评职称、申请基金、招学生,最终绕不开的还是顶刊论文、期刊分区和影响因子;耗费数年心血的研究,可能因为匿名评审人一句“创新性不足”就被拒之门外;而自己作为评审人时,一年要承接少则几份,多的时候有数十份的审稿邀请,根本无法保证每一篇稿件都能细致核查。

2016年教育部印发《关于深化高校教师考核评价制度改革的指导意见》,首次系统性提出纠治唯论文、唯职称倾向;2018年全国教育大会将破除“唯分数、唯升学、唯文凭、唯论文、唯帽子”上升为国家教育改革核心议题;2020年《深化新时代教育评价改革总体方案》出台,成为新中国首个教育评价系统性改革的纲领性文件。顶层设计不可谓不重视,政策文件也不可谓不密集。但八年过去了,我们似乎依然困在顶刊与传统匿名评审的怪圈里。问题的根子到底在哪?这场声势浩大的改革,为何始终难以触及核心?

打开网易新闻 查看精彩图片

一、60年前的旧制度难于适配如今的大科学时代

接下来我要谈论的同行评审制度,或许是你曾经视作神圣不可侵犯的一套策略。在此我先作一个说明:同行评审不是天生的坏制度,恰恰相反,它是近代学术走向规范化、专业化进程中具有里程碑意义的创新。

17~18世纪的欧洲学术圈,论文发表主要由皇家学会、贵族资助的学术机构主导,能否刊发很大程度上取决于主编或少数权威学者的专业判断。彼时虽有初步的学术辩论与书信商榷,但并无独立、程序化的外部评议机制,孟德尔的遗传学定律被埋没35年、魏格纳的大陆漂移学说被斥为异端,都是那个权威独断时代的深刻教训。

19世纪末,外部同行评审开始萌芽;20世纪50~70年代,随着科学研究的职业化与规模化,外部评审在全球期刊界快速普及,到60年代已成为主流做法。而我们如今熟悉的匿名双盲评审,其全面落地则要晚得多。多数顶刊直到二十世纪七八十年代才逐步推广,我记得《自然》也是在这个时候才系统性第引入外部同行评审机制的。

这一制度的诞生,我们可以称之为一场屠龙革命,因为它打破了单一权威的独断,让年轻学者与非主流研究获得了发声机会。同时,建立了学术发表的基本门槛,可以过滤那些明显粗疏、违背学理的研究。自此之后,以同行共识替代个人好恶,支撑了战后全球科研体系的快速扩张。可以说,没有同行评审制度,就没有现代科学的繁荣。

任何制度都有其适用的时代边界。同行评审的设计逻辑,是为了适应20世纪中期“小科学”时代的学术生态。当时全球科研人员数量有限,论文年产量不过数万篇,同行之间彼此熟悉,评审是基于学术责任感的义务劳动,主编拥有最终的决定权和责任。

但进入21世纪,学术生态发生了翻天覆地的变化:全球科研人员数量突破千万,论文年产量超过200万篇,跨学科研究成为主流,科研经费与学术地位的竞争空前激烈。而同行评审制度却几乎没有任何实质性的改革,依然沿用着60年前的运行模式。这种制度设计与时代需求的严重脱节,是导致其异化和失灵的根本原因。也就是说,当年的屠龙少年,在被赋予了远超其设计能力的绝对权力后,已经逐渐异化为我们不得不面对的“权力怪兽”。我们来详细分析一下。

当前全球每年发表学术论文达两、三百万篇,且仍以每年5%以上的速度递增。但愿意投入时间和精力,也有能力认真审稿的科研人员数量,却远远跟不上论文产出的增速。

部分热门领域的活跃学者,年均收到数十份审稿邀请已是常态。从我自己的例子来说,我曾经一周审了三篇稿子。但是,在科研、教学、项目申请的多重压力下,也许对每篇稿件通读全文已经属于很负责的审稿人,再要求核查数据、推敲逻辑,那是根本难于做到的。基于我自己的推测,大多数人实际上评审一篇论文的时间不足3小时(这纯属根据自己的情况进行的推测,如果有真实的调查,请指正),很多时候是仅靠摘要与图表快速给出审稿意见。

这个是可想而知的吧:评审投入不足,将直接导致学术把关的全面失灵:逻辑疏漏、图表重复甚至数据造假的论文,得以顺利通过顶刊评审。现在,科普博主借助AI,通过常识就能揭露问题,让学术共同体尴尬不已。我不得不说,这是现行同行评审制度的耻辱。

其实,同行评审的最初定位,只是判断论文是否存在学术不端,方法是否科学,逻辑是否自洽,类似学术质量底线把关人的角色,并未要求来评判“这篇论文的学术价值有多高”,更不会是决定学者职称晋升、经费分配乃至职业生涯的唯一标准。

在曾经的五唯评价体系下,同行评审的功能被无限放大了。一篇CNS论文,可能带来数百万科研经费、终身教职、数十万奖金,甚至是整个学科的发展资源。相反,一次负面的评审意见,可以让一个青年学者十年的努力付诸东流。当评审结果的收益相差到如此程度,整个学术生态便彻底扭曲。科研人员不再以解决科学问题或实际问题为导向,转而刻意迎合评审人的偏好,不得不放弃高风险的原创性探索,扎堆做安全的热点课题。行文中,堆砌数据与复杂公式,把简单问题复杂化,甚至不惜修饰数据、篡改结果,只为通过评审这道独木桥。

在同行评审制度的早期,主编拥有最终的决定权和责任。评审人的意见只是参考,主编可以根据自己的判断决定是否发表论文。如果发表了问题论文,主编需要承担相应的声誉后果。但随着论文数量的爆炸式增长,主编为了逃避责任,逐渐将决定权全部推给了匿名评审人。如今,绝大多数期刊的发表决策完全取决于2~3位匿名评审人的意见,主编几乎不再干预。

这就产生了同行评审制度下最被忽视也最重要的结构性矛盾:评审既没有给予审稿人应有的劳动报酬,也没有建立合理的责任追究机制,形成了“权利与义务不对等、权力与责任相分离”的畸形格局。

首先必须承认,绝大多数匿名审稿人都是在本职工作之外,无偿承担审稿义务。一篇中等篇幅的学术论文,认真通读、核查数据、撰写详细评审意见,至少需要5~8小时的投入;对于顶刊论文,这个时间可能长达数十小时。而这些劳动,几乎没有任何物质回报,最多只能在期刊网站上获得一个“年度优秀审稿人”的虚拟证书。这种无偿劳动的制度设计,在小科学时代尚可维系,审稿更多是一种基于学术声誉的互惠行为。但在大科学时代,它已难以为继,直接导致审稿人投入不足:当审稿成为一种“费力不讨好”的额外负担,敷衍了事、快速出意见就成了理性选择:既然没有获得相应的报酬,自然也难以要求其承担相应的责任。而真正有水平、有责任心的学者,往往因为时间成本过高而拒绝审稿邀请,最终导致“劣币驱逐良币”。

与此同时,审稿人却拥有论文的放行权、否决权和隐性学术背书权。问题论文曝光后,作者、导师、依托单位都会被追责整改,唯独当初放行把关的匿名审稿人永久隐身,无需承担专业判断失当、草率审稿的任何后果。匿名机制本为规避人情干扰、保护异见表达,如今却异化为草率评审、圈子互捧、恶意打压异见的天然保护伞。

权责对等是现代制度的基本准则。要求无偿劳动的审稿人承担无限责任,既不合理也不现实,但赋予其绝对权力却不要求任何责任,同样违背基本的公平正义。这种双重脱节,是同行评审制度失灵的根源之一。

二、“五唯”本质上是同行评审权重失控的产物

前面所谈及的教育部那个政策出台的原因,是因为很多人将学术生态的恶化归咎于“五唯”本身,但我认为这似乎是一种因果倒置。“五唯”不是凭空产生的,它是同行评审权重失控的必然结果。

现代学术评价体系的逻辑链条极其清晰:同行评审决定论文能否发表→论文发表的期刊等级决定学术水平→学术水平决定职称、帽子、奖项和科研经费。在这个链条中,同行评审几乎是最上游的“总阀门”,所有“五唯”指标都是这个阀门输出的“标准化产品”。

对于高校管理者和基金评审人来说,逐篇阅读每一位学者的论文、判断其真实学术贡献,是一件成本极高的事情。而发表在CNS上、拥有长江学者头衔这些经过同行评审背书的标签,就成了快速筛选人才的捷径。于是,以刊评文、以帽取人成为最省事,看上去也是最“客观”的筛选工具。

另一方面,行政体系天生偏好量化管理。用论文数量、影响因子、人才头衔作为硬指标,既能快速完成自上而下的考核,又能避免主观评价带来的纠纷,还便于高校之间、学科之间进行横向攀比。对管理者来说,“五唯”是成本最低、争议最小的管理方式。哪怕它有万般弊端,也比没有统一标准更容易执行。

反“五唯”改革试图打破这个循环,却选错了突破口。它只砍掉了期刊等级、帽子这些下游指标,却没有触动上游的同行评审垄断权。所以,我认为这才是反“五唯”改革长期停留在表层的根本原因:只要同行评审依然是学术价值的唯一裁判,只要管理者依然用量化指标进行粗放式管理,旧的指标被废除后,新的指标就会立即取而代之。SCI数量不行了,就看顶刊数量,影响因子不行了,就看高被引论文数量,国家级人才不行了,就看其他XX人才。本质上,还是在围着同行评审的指挥棒转。

三、反“五唯”反而加剧了不公

反“五唯”改革的另一个致命误区,是在没有建立有效替代标准的情况下,盲目取消了硬性量化指标。这不仅没有带来更公平的评价,反而导致评价标准的空心化和主观化,让学术权力进一步向少数学阀和圈子集中。

在“五唯”时代,至少还有论文数量、影响因子这些相对客观的硬指标。对于普通青年学者来说,只要足够努力,多发几篇SCI,总能获得晋升的机会。但反“五唯”之后,很多高校取消了论文的硬性要求,代之以“代表作制度”和“同行评议”。

听起来很美好,但实际操作中却变了味。“代表作”的好坏没有客观标准,完全取决于评价委员会的主观判断。而评价委员会的成员,往往都是已经功成名就的“学术大牛”,他们本身就是旧体系的受益者,也是学术圈子的核心人物。于是,“代表作评价”变成了“关系评价”,“同行评议”变成了“圈子评议”。和评委关系好、属于同一个师门或学派的学者,哪怕成果一般,也能得到高分;而那些没有背景、不属于任何圈子的青年学者,哪怕做出了真正有价值的研究,也可能被轻易否决。

更糟糕的是,这种模糊的评价标准,为权力寻租提供了更大的空间。在“五唯”时代,至少还可以用论文数量说话;而现在,学术水平、创新能力这些虚无缥缈的指标,成了可以随意拿捏的橡皮泥。谁掌握了评价权,谁就拥有了分配资源的权力。

这就是为什么很多青年学者感叹:反五唯之后,日子更难过了。以前只要埋头写论文就行,现在还要花大量时间搞关系、混圈子。反“五唯”本来是为了打破学术垄断,结果反而让垄断变得更加隐蔽、更加牢不可破。

打开网易新闻 查看精彩图片

四、让同行评审回归本位,而非废除

难道要废除同行评审吗?当然不是。我们批判它,是因为它被滥用了,而不是因为它本身一无是处。它当年打破权威独断、守护学术底线的进步目标,今天依然值得追求。我们要做的,不是杀死这个曾经屠龙的少年,而是让他长大,让他走出匿名的黑箱,走进现代性的阳光里。如何让同行评审回归学术守门人的本位呢?

首先,最重要的,让同行评审只负责一件事:核查论文是否存在学术不端、数据是否真实可靠、逻辑是否自洽、方法是否科学规范,守住学术诚信的底线。至于这篇论文的学术价值有多高、是否足以支撑职称晋升或项目立项,绝不应该由发表时的2~3位匿名评审人说了算。学术价值的判断权,必须交还给时间和整个学术共同体。一篇论文的真正分量,要看它发表后5~10年的引用情况、行业应用效果、以及全球学者的公开讨论与共识。将“发表时的即时评价”转变为“基于长期影响的事后评价”,才能从根本上消解“为过审而科研”的功利动机。

对应地,需要建立合理的审稿报酬机制,实现权责对等。没有合理的报酬,就没有真正的责任。必须彻底改变目前审稿无偿劳动的现状,建立与劳动强度、专业水平相匹配的审稿报酬制度,可根据论文难度、审稿时长制定差异化标准。同时,建立审稿人积分制度,审稿积分可用于抵扣自身论文的版面费、优先获得期刊服务等。合理的报酬不仅是对审稿人劳动的尊重,更是提高审稿质量、建立责任追究机制的基础。当审稿人获得了应有的回报,要求其对自己的专业判断承担有限责任,才具有道德和制度上的合理性。

评审人可以保留匿名身份以避免报复,但评审过程不能永远是黑箱。论文发表后,必须强制公开评审报告、作者回应和编辑决策记录,将不透明的“黑箱”变成可追溯的“玻璃箱”。可以考虑建立统一的评审人信用档案:对长期认真负责、把关严格的评审人,给予公开表彰和制度激励,对连续放行问题论文、存在不公评审、恶意打压异见的评审人,一经核实,永久取消其在所有学术期刊和基金项目中的评审资格。同时恢复主编有限负责制,主编必须充分吸纳同行评审意见,但拥有最终的学术把关权和签字权,谁签字发表,谁就要承担最终的声誉责任和学术责任。这绝非退回旧式的权威独断,而是用编辑端的显性责任,对冲匿名审稿人的隐性无责任,形成双向制衡。

期刊发表只是学术交流的一种方式,而非学术价值的判决书。必须彻底切断“期刊等级”与“职称晋升、经费分配、人才头衔”的直接绑定,废除“以刊评文”的懒政逻辑。

当审稿人的劳动得到应有的尊重,当评审不再能一票定终身,当学术价值不再由少数人说了算,当科研真正回归求真的初心,“五唯”的顽疾才会从根源上消解。