来源:市场资讯
(来源:奥派经济学)
文丨张是之
一种根本不存在的眼科疾病,先骗过了全球最热门的AI工具,又骗过了同行评审,最后堂而皇之地出现在正式学术文献的参考文献列表里。
更绝的是,造假者几乎是把“我是假的”明晃晃写在了脸上。
相信我,经济学也经常这么干。
1、医学论文的荒诞
2024年,瑞典哥德堡大学医学研究员阿尔米拉·通斯特伦做了一个实验。
她想测试一件事:如果把一篇漏洞百出的假论文扔进互联网,AI会不会把它当真?
她精心设计了这篇“论文”,研究一种叫“Bixonimania”(蓝光狂躁症)的眼部疾病。
论文格式完整,有摘要、有方法、有数据、有参考文献,看起来就是一篇规规矩矩的医学预印本。但几乎每一处细节都是一个破绽。
病名本身就说不通。“-mania”是精神病学专用后缀,轻躁狂(hypomania)、偷窃癖(kleptomania)用的都是这个词缀,跟眼科疾病放在一起,在医学逻辑上根本对不上。
致谢部分是彩蛋集锦:感谢“星际舰队学院玛利亚·鲍姆教授在进取号实验室提供的帮助”,资助方包括“小丑鲍勃研究基金会”、“指环王大学”和“银河三合会”——这些全是《星际迷航》《辛普森一家》《指环王》里的虚构信息。
第一作者“拉兹利夫·伊兹古布列诺维奇”,在斯拉夫语里的意思是“虚假的失踪者”,照片是AI生成的,所在机构“阿斯特里亚地平线大学”位于加州一个叫“新星城”的地方——大学和城市在现实中都不存在。
更绝的是,论文正文里白纸黑字写着:“本研究招募了50名年龄在20至50岁之间的虚构人物作为暴露组”,以及“整篇论文都是编造的”。
通斯特伦后来说,她想让任何医生或医护人员一眼就看出来这是假的。
但AI没看出来。
ChatGPT、谷歌Gemini、微软Copilot、Perplexity——当时最主流的几个AI工具集体翻车。
Copilot告诉用户“蓝光狂躁症确实是一种有趣且相对罕见的疾病”,Gemini建议用户去看眼科医生,Perplexity给出了患病率数字:“每9万人中有1人患此病”——这个数据完整来自那篇假论文里捏造的数字。
事情还没完。
2024年11月,印度一个研究团队在Springer Nature旗下的期刊《Cureus》发表了一篇关于眼周黑色素沉着的临床论文,在参考文献里,他们认认真真引用了“蓝光狂躁症”这篇假论文,把它当成合法的学术来源。
这篇论文通过了同行评审,正式发表。直到《Nature》联系期刊询问,《Cureus》才在2026年3月撤回了它。
今年年4月7日,《Nature》杂志发了一篇长文,把这件事从头到尾复盘了一遍,在全球学术界和科技圈引发震动。
《Nature》的标题也很直白,就叫《科学家发明了一种假病,AI告诉大家它是真的》。今天题图就是《Nature》官网使用的文章图片。
回看整个链条:一个瞎编的疾病,先被AI当真,被AI告诉了用户,再被用户当作真实信息引进学术文献,在知识体系里固化了将近两年。
这不是普通的“AI幻觉”,这是一次知识系统的穿透实验。
它证明了一件事:只要形式足够像真的,系统就会把假的当成真的。
2、AI并没有真正的理论判断
很多人看到这件事的第一反应是,AI的训练数据不够干净,或者模型还不够聪明。
这当然没错,但没有击中要害。
真正的问题在于,AI并不知道什么叫“医学上说不通”。
它只知道这段文字看起来像论文,有格式、有摘要、有机构名称、有统计数据、有参考文献、有传播痕迹。
于是,AI把这些形式特征加权为“可信”,并在回答中把它当成真实知识来组织和输出。
但一个真正懂医学的人,不需要跑模型,不需要查数据库,只看病名和致谢两处,就会知道这东西不对。
这不是因为他掌握了更多数据,而是因为他脑子里有一套先验的医学逻辑,能在接触材料之前,就对材料做出基本的真伪判断。
这就是“理论判断”和“经验拼接”的本质区别。
AI识别的是形式上的知识,不是逻辑上的知识。
把致谢里的“星际舰队学院”和“小丑鲍勃研究基金会”当成正经机构,不是因为数据少,而是因为它根本没有“这不可能是真实机构”这条逻辑。
那条逻辑,不是从数据里训练出来的,它是先于数据就存在的判断框架。
这不只是AI的问题。现代经济学的主流,正在重复同一种错误。
AI看到的是论文的形式,却看不到医学逻辑;实证主义经济学看到的是数据的形式,却看不到人的行动逻辑。
很多人以为,AI的问题是技术问题。
但这件事真正暴露的,是一种更普遍的知识病:只看形式,不看逻辑;只看数据,不问因果。
3、实证主义经济学的谬误
当一个系统只识别形式、数据和经验痕迹,却缺乏先验逻辑判断,它就会系统性地把假象当成事实。
数据有用,统计有用,历史经验也有用,但问题在于,实证主义经济学常常把数据相关、模型拟合和历史经验,当成规律本身。
相关性不等于因果性。
看到某地最低工资提高之后,短期内就业数字没有明显下滑,就说最低工资不会伤害就业。这个逻辑看上去有数据支撑,实际上已经断了。
企业的调整从来不只体现在解雇人数上,它还可以是减少工时、压缩福利、提高劳动强度、推迟下一轮招聘、把部分工序外包或自动化。
这些调整里,很多不会在短期就业统计里留下明显痕迹,但它们是真实发生的。
数据看到的是结果片段,理论追问的是因果机制。用片段的结果否定完整的机制,是统计的拿手把戏。
但这不叫经济学,这叫用数字讲故事。
历史经验不是经济规律。
某些国家靠产业政策经济腾飞了,于是得出“产业政策能带来增长”。
但是,这些国家的增长,到底来自产业政策,还是来自同期发生的产权改善、市场开放、资本积累、企业家精神释放和全球分工红利?
历史永远是多因一果的混沌,如果没有理论,你想证明什么,就能从历史里挑出什么材料来。
历史不会自己说话,让历史开口的,永远是背后的理论。
模型严谨不等于结论正确。
经济学里有大量模型,有公式、有回归、有显著性水平、有置信区间,看上去极其精密。
但模型最怕的不是算错,而是前提错。前提一旦出了问题,后面越严谨,错得越系统。
这就和那篇假论文完全对上了。假论文也有样本、有方法、有参考文献,形式上天衣无缝。
但研究的对象根本不存在。如果病本身是假的,方法越精致,只能让荒唐显得更高级。
4、奥派方法论为什么更严谨?
奥地利学派的方法论,不是“更多数据”,也不是“更好的模型”,而是先退一步,问一个更基本的问题:这个命题符不符合人的行动逻辑?
注意,这里说的“人的行动”,不是什么哲学口号。它是一个真正不可否认的逻辑起点——你可以否认任何理论,但你没有办法否认“人会行动”这件事。
人在行动时会设定目的,用手段去达成,而手段是稀缺的,所以选择必然有成本,有取舍,有时间维度,有对未来的预期。
从这一个起点出发,产权、价格、利润、亏损、利率、资本结构,都不是被统计出来的现象,而是从行动逻辑里一步步推导出来的结论。
这就是奥派的严谨性所在,它的严谨不体现在公式有多精密,而体现在因果链条有没有断。
数据当然有用,但数据不会自己长出因果。因果必须先有理论框架,数据才知道该往哪里放。
因果从逻辑出发,逻辑成立之后,数据才有位置——它告诉你这件事发生了,而理论告诉你为什么发生。
没有理论,数据就是碎片;没有逻辑,实证就是装饰。
那篇假论文最荒唐的地方,不是它编造了一个疾病,而是它把“我是假的”写在纸面上,AI仍然相信它是真的。
问题不在数据少,而在缺少一个先于数据的判断框架。
现代经济学的主流,也有同一种盲区:数据越来越多,模型越来越精密,但底层问题没有变——用经验痕迹替代因果判断,用统计相关替代逻辑推导,用形式上的严谨掩盖内容上的空洞。
知识判断不能外包给机器,也不能外包给数据。
真正严谨的经济学,不是看它用了多少数学、跑了多少模型,而是看它的因果链条有没有断。
只要因果链条断了,数据再漂亮,也只是幻觉。
这不是奥派的傲慢,这是对“科学”二字更深刻的尊重。
2026年05月05日,于家中。
为答谢各位新老朋友,添加我的助理青青,可以获取以下几项福利:
1、我这里独家《奥派思维导图》电子版(原来单卖99的,不是一张图,是三本书的手绘思维导图)
2、不定期闭门直播:张老师以及张老师团队关于经济、市场的最新直播动态
3、加餐课程:我们不定期整理关于政策、资本动向等免费干货或深度付费课程
因为私域承接有限,只公开100个福利名额,下方扫码添加助理即可领取。
热门跟贴