近期,“耿同学讲故事”实名举报南开大学生命科学学院院长陈佺在《自然》子刊发表论文涉嫌数据造假,引发学术圈内外广泛关注。

打开网易新闻 查看精彩图片

耿同学指出,论文补充材料中64个数据的小数点后两位完全相同,这种异常在真实实验数据中几乎不可能出现。南开大学已就此成立调查组,启动调查程序。

与此同时,经济学家吴敬琏早年批评学术圈“整词儿”现象的声音再次被人提起。他说,养那些只会“整词儿”的专家有什么用?过段时间就出现一堆新词儿,但问题还在那儿摆着。这两件事看似无关,却共同揭示了当前学术生态中的两个病灶:理科论文造假、文科论文造词。

理工科造假靠数据作假,有迹可循,容易败露;文科造假则靠术语堆砌,概念游戏打得花团锦簇,反倒不那么容易被戳穿。然而无论形式如何,本质上都是脱离事实,逃避了学术研究“求真”这一根本使命。
理科论文造假之所以相对容易被发现,根本原因在于其研究对象具有可验证性。理工农医类研究建立在实验和观测数据之上,论文的结论是否成立,同行可以通过重复实验或数据分析来检验。陈佺论文中的64个数据小数点后两位完全一致,这种精密的人为痕迹在统计上几乎不可能出自真实实验。

打开网易新闻 查看精彩图片

类似的案例不胜枚举:近年来有大量研究发现,某些研究中“选择性呈现数据”的问题十分普遍,剔除那些异常数据后,相当比例的循证医学结论发生逆转。统计学方法能够甄别样本量夸大等造假行为,因为数据之间存在内在的逻辑关联,一旦造假,这种关联就会被破坏。

理科论文造假者面临的困难正在于此:你可以在论文中编造一组数据,然而你很难让这组数据在各个层面都保持逻辑自洽。

高手终究怕高手,耿同学的举报之所以一针见血,正在于他用实验数据的逻辑规律戳穿了表面的技术包装。
文科论文造假则呈现出另一种面貌。它很难被轻易识破,因为人文社会科学缺乏理工科那种“数据对账”的载体。没有实验数据可供核对,没有可以重复验证的物质实验,造假者便有了更大的藏身空间。

最常见的造假形式是抄袭拼凑,比如西北大学文学院教师贾浅浅2014年发表的论文,查重后发现相似度高达83.96%,原创度仅16.04%,且存在直接照搬他人文章、低级抄写错误频出等问题。

打开网易新闻 查看精彩图片

可比抄袭更隐蔽、也更普遍的问题是“造词”。

吴敬琏批评的“整词儿”现象在人文社科领域尤其常见:一些学者为追求“学术创新”的表象,刻意套用西方理论术语,甚至沉浸于发明概念。于是我们看到所谓“视觉符号的解构性阐释”“审美意识形态的编码与解码”“伦理范式的解构性耦合”之类拗口难懂的表述充斥学术刊物。

北京语言大学教授李宇明将这些不良文风归纳为“概念游戏”“语录汇编”“玄谈空论”和“形式主义”。学术论文逐渐失去与现实对话的能力,离真正的学识积累越来越远。
问题在于,为什么文科学者甘愿沉溺于造词游戏而不直面真问题?表面上看,是因为缺乏数据的硬约束,造词远比做真研究容易。但更深层的原因在于学术评价体系的偏差。当前高校的职称晋升、项目申请仍高度依赖量化指标,论文数量被奉为硬指标,“不发表就出局”的焦虑迫使研究者追求“短平快”的产出。你是老老实实扎根田野、蹲点调查三五年写一篇真论文,还是套用几个时髦理论、制造几个新概念、三个月发表三四篇“学术成果”,在前者身上收获的回报远不如后者。

学术刊物同样面临“保位置”的压力:为了维持引用率和影响因子,不得不多发知名学者的文章,对概念的创新往往比对问题的深挖更加敏感。久而久之,形式大于内容、概念大于问题的风气越演越烈,大量跟风凑数、应付考评的“伪研究”成果充斥其中,远观符合学术规范,近看却没啥实际价值。

所谓伪研究,就是脱离具体问题在文字层面整活儿,在概念上玩游戏,用大词掩盖小道理。

打开网易新闻 查看精彩图片

理科论文造假和文科论文造词,根源都在于学术界对“创新”的畸形追求。一个靠篡改实验数据去迎合理论预设,一个靠堆砌陌生术语去制造虚假的理论深度,手段不同,疲态一致。

因此,解决问题的办法不在技术层面,而在观念层面。对于理工科,当务之急是建立更严格的数据核验机制和结果可重复性标准,让伪造者无所遁形;对于人文社科,则需要从治学和评价的根本上下功夫,鼓励学者沉下去研究真问题,而不是飘在云端造新词。

就像吴敬琏所提醒的,把简单的道理讲复杂容易,把复杂的问题讲清楚才见真功夫。好文章不是靠“敲响大词的门”,而是要实事求是,一针一线,一分一毫都不容虚与委蛇。学术的尊严从来不在于术语的奇崛,而在于它是否诚实地面对事实、严谨地接近真相。