凌晨两点,三屏代码和一个顽固的报错。我盯着那几百万行数学公式,它们正在学习辨认一只猫。这种时刻我总会走神:我们是怎么从听话的计算器,走到这里的?
这事得从一场赌局说起。1950年,阿兰·图灵(Alan Turing)在论文里扔了个问题:如果人类思维能被逻辑描述,那"思考"本身算不算一种计算?他没等答案,直接把问题变成了测试——让机器跟人聊天,如果聊完对方分不清谁是机器,就算通过。
从"自动推理"到第一次寒冬
图灵的问题像根引线,1956年达特茅斯会议直接点了火。约翰·麦卡锡(John McCarthy)在那场会上正式给这领域命名:人工智能。马文·明斯基(Marvin Minsky)也在场,后来成了MIT AI实验室的掌舵人。
那帮人乐观得离谱。他们相信十年内机器就能翻译语言、证明定理、像人一样思考。钱涌进来,实验室灯火通明。但有个致命假设被他们忽略了:智能可以靠手工编码的逻辑规则堆出来。
1969年,明斯基和同事出了本书,用数学证明单层神经网络连"异或"问题都解决不了。这记闷棍直接抽干了连接主义(Connectionism)的资金管道。AI第一次寒冬降临,从1970年代初拖到1980年代末,整整十五年。
讽刺的是,明斯基晚年承认那本书的杀伤力被放大了。但当时没人关心,钱已经流向了别的地方。
专家系统的虚假繁荣
1980年代,日本搞了个第五代计算机计划,欧美跟着慌。新路线叫"专家系统"——把医生的诊断规则、律师的判例逻辑,一条条写进数据库。MYCIN能诊断血液感染,DENDRAL能分析化学分子结构。
这套玩法有个天花板:知识获取瓶颈。每新增一个领域,得请专家坐几个月,把脑子里的经验翻译成if-then规则。维护成本指数级膨胀,系统却脆弱得像玻璃——遇到没写进规则的情况,直接宕机。
1987年,专用AI硬件市场崩盘。 Lisp机器(Lisp Machine)厂商接连倒闭,第二次寒冬比第一次更冷。到1990年代初,"人工智能"这个词在学术圈都成了忌讳,研究者改口叫"机器学习""数据挖掘""智能系统"。
神经网络的地下复活
寒冬里有人在偷偷点火。1986年,杰弗里·辛顿(Geoffrey Hinton)等人用反向传播算法(Backpropagation)证明:多层神经网络可以解决异或问题。明斯基当年的数学限制被打破了,但没人注意——AI的信誉已经破产。
辛顿带着连接主义的小圈子,像地下党一样活动了二十年。他们在统计学和认知科学的边缘找活路,用"计算神经科学"当掩护。关键突破来自一个意外:2006年,辛顿发表深度信念网络(Deep Belief Network)论文,预训练(Pre-training)技术让深层网络终于能稳定训练。
这时间点踩得极准。GPU游戏显卡刚好普及,算力成本断崖式下跌;互联网积累了足够的数据燃料;ImageNet竞赛在2009年启动,给了算法一个公开擂台。2012年,辛顿的学生用卷积神经网络(Convolutional Neural Network)把图像识别错误率砍掉一半,深度学习(Deep Learning)这个词重新上桌。
历史在这里拐了个弯:不是理论先突破,而是工程条件凑齐了。
从ImageNet到ChatGPT的13年
2012年之后的故事被讲烂了,但有个细节常被忽略。深度学习复兴的头几年,工业界比学术界更激进。Google 2014年收购DeepMind,Facebook(现Meta)挖走杨立昆(Yann LeCun)当AI实验室主任,百度2013年就成立了深度学习研究院。
资金结构变了。以前是NSF(美国国家科学基金会)和DARPA(美国国防部高级研究计划局)撒钱,现在变成科技公司的营收部门直接下注。研究节奏从"发论文等审稿"变成"每周迭代看指标"。
Transformer架构2017年诞生时,Google Brain团队把它当翻译工具用。没人预料到,这个注意力机制(Attention Mechanism)会成为大语言模型的骨架。GPT-1在2018年发布,参数1.17亿;GPT-3 2020年跳到1750亿;GPT-4 2023年,OpenAI连参数数量都不公布了。
规模定律(Scaling Law)被验证:模型越大、数据越多、训练越久,能力曲线持续上升。这违背了传统计算机科学的直觉——以前认为算法效率才是瓶颈,现在发现 brute force(暴力计算)本身就能涌现新能力。
「我们不是在设计智能,是在培养它。」OpenAI研究员在2023年的一次内部分享中这样说。
但这话有个漏洞。培养出来的东西,你其实不知道它怎么工作的。Transformer的注意力权重可以可视化,但百亿参数交织后的整体行为,至今没有完整的理论解释。我们造出了能通过律师资格考试的系统,却说不清它"理解"法律条文的方式,跟人类法学生有何不同。
图灵测试的幽灵
2023年,GPT-4在部分场景下通过了图灵测试的变体版本。但这事本身已经不重要了——图灵当年设想的"模仿游戏",早被重新定义过无数次。
真正的问题是:当机器能生成以假乱真的论文、代码、图像、视频,"真实"和"伪造"的边界在哪里?1950年图灵问的是"机器能思考吗",2024年我们问的是"我需要关心它是不是在思考吗"。
有个数据点很少被提及:2023年Stack Overflow的流量同比下降了15%,程序员开始习惯先问AI再查文档。不是AI比文档准确,是它更快、更贴合具体场景。这种替代不是功能性的,是体验性的——就像当年搜索引擎替代图书馆卡片目录,不是因为它更全,是因为它更顺。
历史在这里押韵。1956年达特茅斯会议的组织者相信,夏天两个月的密集讨论就能在机器智能上取得重大进展。他们错了,但错的方式很有意思:不是方向反了,是时间表太乐观。七十年的迂回、两次寒冬、无数次路线斗争,最后靠工程暴力打开了缺口。
现在轮到我们犯错了。关于通用人工智能(Artificial General Intelligence,AGI)的时间表,乐观派说2027年,保守派说"可能永远不会"。两边都缺乏过硬的证据,但赌注已经押下——微软向OpenAI投了超过130亿美元,Google把Gemini塞进所有产品线,中国大厂在2023年集体发布大模型。
凌晨三点,报错终于消失。模型开始收敛,损失曲线稳步下降。我看着屏幕上那只被正确识别的猫,想起图灵1950年论文的最后一句话:「我们只能看到前方不远的地方,但我们可以看到那里有很多需要完成的工作。」
他漏掉了一个问题:当工作被完成后,谁来定义"完成"的标准?
热门跟贴