“理科论文造假，文科论文造词”|学术|文科|文章|理工科|理科|论文造假|论文造词

近期，“耿同学讲故事”实名举报南开大学生命科学学院院长陈佺在《自然》子刊发表论文涉嫌数据造假，引发学术圈内外广泛关注。

耿同学指出，论文补充材料中64个数据的小数点后两位完全相同，这种异常在真实实验数据中几乎不可能出现。南开大学已就此成立调查组，启动调查程序。

与此同时，经济学家吴敬琏早年批评学术圈“整词儿”现象的声音再次被人提起。他说，养那些只会“整词儿”的专家有什么用？过段时间就出现一堆新词儿，但问题还在那儿摆着。这两件事看似无关，却共同揭示了当前学术生态中的两个病灶：理科论文造假、文科论文造词。

理工科造假靠数据作假，有迹可循，容易败露；文科造假则靠术语堆砌，概念游戏打得花团锦簇，反倒不那么容易被戳穿。然而无论形式如何，本质上都是脱离事实，逃避了学术研究“求真”这一根本使命。
理科论文造假之所以相对容易被发现，根本原因在于其研究对象具有可验证性。理工农医类研究建立在实验和观测数据之上，论文的结论是否成立，同行可以通过重复实验或数据分析来检验。陈佺论文中的64个数据小数点后两位完全一致，这种精密的人为痕迹在统计上几乎不可能出自真实实验。

类似的案例不胜枚举：近年来有大量研究发现，某些研究中“选择性呈现数据”的问题十分普遍，剔除那些异常数据后，相当比例的循证医学结论发生逆转。统计学方法能够甄别样本量夸大等造假行为，因为数据之间存在内在的逻辑关联，一旦造假，这种关联就会被破坏。

理科论文造假者面临的困难正在于此：你可以在论文中编造一组数据，然而你很难让这组数据在各个层面都保持逻辑自洽。

高手终究怕高手，耿同学的举报之所以一针见血，正在于他用实验数据的逻辑规律戳穿了表面的技术包装。
文科论文造假则呈现出另一种面貌。它很难被轻易识破，因为人文社会科学缺乏理工科那种“数据对账”的载体。没有实验数据可供核对，没有可以重复验证的物质实验，造假者便有了更大的藏身空间。

最常见的造假形式是抄袭拼凑，比如西北大学文学院教师贾浅浅2014年发表的论文，查重后发现相似度高达83.96%，原创度仅16.04%，且存在直接照搬他人文章、低级抄写错误频出等问题。

可比抄袭更隐蔽、也更普遍的问题是“造词”。

吴敬琏批评的“整词儿”现象在人文社科领域尤其常见：一些学者为追求“学术创新”的表象，刻意套用西方理论术语，甚至沉浸于发明概念。于是我们看到所谓“视觉符号的解构性阐释”“审美意识形态的编码与解码”“伦理范式的解构性耦合”之类拗口难懂的表述充斥学术刊物。

北京语言大学教授李宇明将这些不良文风归纳为“概念游戏”“语录汇编”“玄谈空论”和“形式主义”。学术论文逐渐失去与现实对话的能力，离真正的学识积累越来越远。
问题在于，为什么文科学者甘愿沉溺于造词游戏而不直面真问题？表面上看，是因为缺乏数据的硬约束，造词远比做真研究容易。但更深层的原因在于学术评价体系的偏差。当前高校的职称晋升、项目申请仍高度依赖量化指标，论文数量被奉为硬指标，“不发表就出局”的焦虑迫使研究者追求“短平快”的产出。你是老老实实扎根田野、蹲点调查三五年写一篇真论文，还是套用几个时髦理论、制造几个新概念、三个月发表三四篇“学术成果”，在前者身上收获的回报远不如后者。

学术刊物同样面临“保位置”的压力：为了维持引用率和影响因子，不得不多发知名学者的文章，对概念的创新往往比对问题的深挖更加敏感。久而久之，形式大于内容、概念大于问题的风气越演越烈，大量跟风凑数、应付考评的“伪研究”成果充斥其中，远观符合学术规范，近看却没啥实际价值。

所谓伪研究，就是脱离具体问题在文字层面整活儿，在概念上玩游戏，用大词掩盖小道理。