图灵70年前埋的1颗雷，2024年炸出了ChatGPT|人工智能|图灵7|明斯基|算法|约翰·麦卡锡|翻译|艾伦·图灵|超级智能|阿兰·图灵

凌晨两点，三屏代码和一个顽固的报错。我盯着那几百万行数学公式，它们正在学习辨认一只猫。这种时刻我总会走神：我们是怎么从听话的计算器，走到这里的？

这事得从一场赌局说起。1950年，阿兰·图灵（Alan Turing）在论文里扔了个问题：如果人类思维能被逻辑描述，那"思考"本身算不算一种计算？他没等答案，直接把问题变成了测试——让机器跟人聊天，如果聊完对方分不清谁是机器，就算通过。

从"自动推理"到第一次寒冬

图灵的问题像根引线，1956年达特茅斯会议直接点了火。约翰·麦卡锡（John McCarthy）在那场会上正式给这领域命名：人工智能。马文·明斯基（Marvin Minsky）也在场，后来成了MIT AI实验室的掌舵人。

那帮人乐观得离谱。他们相信十年内机器就能翻译语言、证明定理、像人一样思考。钱涌进来，实验室灯火通明。但有个致命假设被他们忽略了：智能可以靠手工编码的逻辑规则堆出来。

1969年，明斯基和同事出了本书，用数学证明单层神经网络连"异或"问题都解决不了。这记闷棍直接抽干了连接主义（Connectionism）的资金管道。AI第一次寒冬降临，从1970年代初拖到1980年代末，整整十五年。

讽刺的是，明斯基晚年承认那本书的杀伤力被放大了。但当时没人关心，钱已经流向了别的地方。

专家系统的虚假繁荣

1980年代，日本搞了个第五代计算机计划，欧美跟着慌。新路线叫"专家系统"——把医生的诊断规则、律师的判例逻辑，一条条写进数据库。MYCIN能诊断血液感染，DENDRAL能分析化学分子结构。

这套玩法有个天花板：知识获取瓶颈。每新增一个领域，得请专家坐几个月，把脑子里的经验翻译成if-then规则。维护成本指数级膨胀，系统却脆弱得像玻璃——遇到没写进规则的情况，直接宕机。

1987年，专用AI硬件市场崩盘。 Lisp机器（Lisp Machine）厂商接连倒闭，第二次寒冬比第一次更冷。到1990年代初，"人工智能"这个词在学术圈都成了忌讳，研究者改口叫"机器学习""数据挖掘""智能系统"。

神经网络的地下复活

寒冬里有人在偷偷点火。1986年，杰弗里·辛顿（Geoffrey Hinton）等人用反向传播算法（Backpropagation）证明：多层神经网络可以解决异或问题。明斯基当年的数学限制被打破了，但没人注意——AI的信誉已经破产。

辛顿带着连接主义的小圈子，像地下党一样活动了二十年。他们在统计学和认知科学的边缘找活路，用"计算神经科学"当掩护。关键突破来自一个意外：2006年，辛顿发表深度信念网络（Deep Belief Network）论文，预训练（Pre-training）技术让深层网络终于能稳定训练。

这时间点踩得极准。GPU游戏显卡刚好普及，算力成本断崖式下跌；互联网积累了足够的数据燃料；ImageNet竞赛在2009年启动，给了算法一个公开擂台。2012年，辛顿的学生用卷积神经网络（Convolutional Neural Network）把图像识别错误率砍掉一半，深度学习（Deep Learning）这个词重新上桌。

历史在这里拐了个弯：不是理论先突破，而是工程条件凑齐了。

从ImageNet到ChatGPT的13年

2012年之后的故事被讲烂了，但有个细节常被忽略。深度学习复兴的头几年，工业界比学术界更激进。Google 2014年收购DeepMind，Facebook（现Meta）挖走杨立昆（Yann LeCun）当AI实验室主任，百度2013年就成立了深度学习研究院。

资金结构变了。以前是NSF（美国国家科学基金会）和DARPA（美国国防部高级研究计划局）撒钱，现在变成科技公司的营收部门直接下注。研究节奏从"发论文等审稿"变成"每周迭代看指标"。

Transformer架构2017年诞生时，Google Brain团队把它当翻译工具用。没人预料到，这个注意力机制（Attention Mechanism）会成为大语言模型的骨架。GPT-1在2018年发布，参数1.17亿；GPT-3 2020年跳到1750亿；GPT-4 2023年，OpenAI连参数数量都不公布了。

规模定律（Scaling Law）被验证：模型越大、数据越多、训练越久，能力曲线持续上升。这违背了传统计算机科学的直觉——以前认为算法效率才是瓶颈，现在发现 brute force（暴力计算）本身就能涌现新能力。

「我们不是在设计智能，是在培养它。」OpenAI研究员在2023年的一次内部分享中这样说。

但这话有个漏洞。培养出来的东西，你其实不知道它怎么工作的。Transformer的注意力权重可以可视化，但百亿参数交织后的整体行为，至今没有完整的理论解释。我们造出了能通过律师资格考试的系统，却说不清它"理解"法律条文的方式，跟人类法学生有何不同。

图灵测试的幽灵

2023年，GPT-4在部分场景下通过了图灵测试的变体版本。但这事本身已经不重要了——图灵当年设想的"模仿游戏"，早被重新定义过无数次。

真正的问题是：当机器能生成以假乱真的论文、代码、图像、视频，"真实"和"伪造"的边界在哪里？1950年图灵问的是"机器能思考吗"，2024年我们问的是"我需要关心它是不是在思考吗"。

有个数据点很少被提及：2023年Stack Overflow的流量同比下降了15%，程序员开始习惯先问AI再查文档。不是AI比文档准确，是它更快、更贴合具体场景。这种替代不是功能性的，是体验性的——就像当年搜索引擎替代图书馆卡片目录，不是因为它更全，是因为它更顺。

历史在这里押韵。1956年达特茅斯会议的组织者相信，夏天两个月的密集讨论就能在机器智能上取得重大进展。他们错了，但错的方式很有意思：不是方向反了，是时间表太乐观。七十年的迂回、两次寒冬、无数次路线斗争，最后靠工程暴力打开了缺口。

现在轮到我们犯错了。关于通用人工智能（Artificial General Intelligence，AGI）的时间表，乐观派说2027年，保守派说"可能永远不会"。两边都缺乏过硬的证据，但赌注已经押下——微软向OpenAI投了超过130亿美元，Google把Gemini塞进所有产品线，中国大厂在2023年集体发布大模型。

凌晨三点，报错终于消失。模型开始收敛，损失曲线稳步下降。我看着屏幕上那只被正确识别的猫，想起图灵1950年论文的最后一句话：「我们只能看到前方不远的地方，但我们可以看到那里有很多需要完成的工作。」

他漏掉了一个问题：当工作被完成后，谁来定义"完成"的标准？