来源:市场资讯
(来源:可遥笔记)
一、三段押韵
公元前一〇四二年,周武王崩,成王年幼,周公旦摄政七年,还政于侄,退居臣位。这件事被儒家传颂了三千年,写进了每一部政治教科书的第一页。
可如果你把二十四史里所有"托孤辅政"的案例拉出来——从西周到晚清,几乎每一个有重要辅政者的朝代都有案例——你会发现一个令人不安的事实:周公归政是儒家三千年传颂的标杆,但放眼整个二十四史,几乎每一个重要的辅政者都没能复制周公的结局。摄政者的命运不是"功成身退",而是"功成身死"。周公之所以被推为圣人,恰恰因为他做到的事再没有第二个人做到过。圣人的定义,就是不可复制。
再看另一条韵脚。秦始皇打下天下,二世而亡。隋文帝统一南北,二世而亡。这两个案例人人知道,但如果把视野拉宽:王莽新朝一世而亡,新朝算不算"二代崩塌"的极端版本?杨广和胡亥的相似度,不在性格,在结构——前代以铁腕建制,后代以挥霍拆台,中间没有缓冲机制。这条韵脚在史料里反复出现,从秦到元,节拍几乎一致。
第三条更隐蔽。商鞅变法,秦国由弱变强,商鞅本人却被车裂。王安石变法,开制度化改革先河,本人罢相退居金陵,新法在身后被逐条废除。张居正十年新政,万历朝的财政和吏治为之一振,死后四天即被追夺官秩,抄家时家属饿死数人。变法者的命运,几乎和摄政者一样冷酷:制度可以留下,人留不下。
这些不是巧合。这是韵脚。
二、缘起
我本科读的是物理,但对历史一直有割舍不下的兴趣。可惜文言文水平一般,读起来慢,《资治通鉴》二百九十四卷,从战国跨到五代,啃了十几年还停在前几册,遥遥无期。倒是史景迁的几本——《王氏之死》《追寻现代中国》《前朝梦忆》——读完之后久久震撼。郯城县一个普通妇人的死,他能写出整个康熙朝的赋税、灾荒与地方权力结构。从一粒沙里看见整片沙漠的本事,是我对"史学家"三个字的想象底片。
之前完成过一个《价值投资九十年》的项目,把几十位价值投资大师的著作和访谈用大语言模型提炼成知识图谱。【1】我用AI整理了价值投资90年的思想史做完那件事,自然想到把同样的方法论搬到其他领域——海量原始资料里提取信息,把碎片聚类成模式,再综合写成可读的叙事。提取、聚类、综合,三个步骤。
历史这个领域,是这套方法论最适合也最有挑战的应用。文献多到任何个人都读不完,模式藏得深,跨朝代映射又是传统工具触不到的地方。
直到大语言模型出现。马克·吐温有句被传颂的话:"History doesn't repeat itself, but it often rhymes"(历史不重复,但常常押韵)。这句话过去是文学式的隐喻——漂亮,但不可操作。你没法拿着这句话去检索二十四史,没法量化"押"在哪里、"韵"有多深。现在它变成了一个可以量化的工程问题。
大语言模型能读文言文,能做段落级语义抽取,能在海量记录之间做跨时代的模式匹配。这意味着"历史押韵"不再是一句漂亮的格言,而是一个可以被拆解、被验证、被反驳的命题。
这个项目叫《历史的韵脚》。它试图回答一个问题:如果把三千年中国正史喂进大语言模型,韵脚到底有多少条,每条押了多少次?
三、这件事以前为什么没人做
不是没人想过。
中国传统史学的最高成就,是"通"——司马光的《资治通鉴》通的是编年,司马迁的《史记》通的是纪传,钱穆的《国史大纲》通的是脉络。每一种"通"都需要一个人穷尽一生的阅读量,在脑子里建起一座跨朝代的索引。钱穆先生在《国史大纲》引论里说,读史要有"温情与敬意",这话背后的潜台词是:你得先读完,才谈得上温情。而读完这件事,在物理意义上就已经把绝大多数人挡在了门外。
陈寅恪先生的路数不同。他不追求"通读",而是"深钻"——从一首诗、一段墓志铭里钩沉出整个时代的政治结构与社会网络。《元白诗笺证稿》从元稹和白居易的诗里读出了中晚唐的牛李党争与进士行卷制度,精彩绝伦。但这是手工业。陈先生能处理的文本量,受限于一个人的精力和视力——他晚年双目失明,仍然口述考证,靠的是惊人的记忆力,而不是检索工具。这种方法论的天花板,是个体生命的天花板。
二十世纪中叶以后,西方出现了计量史学和数字人文。思路是对的:用数据库和统计方法处理历史材料。但计量史学能处理的,是已经结构化的数据——粮价、人口、税收、贸易额。它处理不了"意义"。你可以统计唐代进士的籍贯分布,但你没法用数据库查询"唐代的制度演化是否和明代同构"。数字人文走得更远一些,做了大量文本数字化和关键词检索的工作,但关键词检索的局限是:你必须先知道要搜什么。如果你不知道某个模式存在,你就不会去搜它。
问题的本质是:跨朝代的模式识别,需要同时满足三个条件——海量阅读、语义理解、跨时代映射。传统学者有语义理解但没有海量阅读的物理可能;计量史学有海量处理但没有语义理解;数字人文有文本但没有跨时代映射的能力。
在大语言模型出现之前,没有任何一种工具能同时满足这三个条件。
这不是在贬低前人。恰恰相反,这个项目的每一步都站在前人的肩膀上——没有中华书局的点校本,没有台湾"中研院"的汉籍电子文献,没有几代学者的注疏和翻译,大语言模型读到的就是一堆乱码。工具变了,敬意不变。
四、语料与规模
第一步是把书读进来。
一百二十多套中文历史书构成了这次的语料库。其中二十三部正史:从《史记》到《清史稿》,加上《资治通鉴》,涵盖了中国官修史书的全部主干。八十七部现代史学要籍:钱穆的《国史大纲》《中国历代政治得失》,吕思勉的《中国通史》,杨宽的《战国史》,陈寅恪的《隋唐制度渊源略论稿》《唐代政治史述论稿》,田余庆的《东晋门阀政治》,葛兆光的《中国思想史》,余英时的《朱熹的历史世界》,王明珂的《华夏边缘》,阎步克的《品位与职位》,茅海建的《天朝的崩溃》,杨奎松、沈志华的近现代史研究,田晓菲的《秋水堂论金瓶梅》与《赤壁之戟》——这份书单本身就是一部二十世纪中国史学的缩影。另有十四部海外汉学中译本:史景迁、卜正民、孔飞力、杉山正明、罗威廉等人的代表作。
数千万字,时间跨度从商代甲骨(约公元前一二五〇年)到一九一一年清朝覆亡,约三千一百六十年。
然后是提取、聚类、综合三步走。
五、方法论:提取、聚类、综合
中国历史学界过去做过不少优秀的专题数据库——比如中研院的汉籍全文资料库、哈佛的中国历代人物传记资料库——每一个都是十年以上的积累。它们解决的是"原文随手可查"的问题。这次想做的是另一件事:在原文之上,让大语言模型帮我把跨朝代的模式拉到同一张桌子上做对照。
具体分三步。
第一步,提取。一百二十多套书的电子化质量参差不齐,有些是高质量的点校本,有些是扫描件。先做光学字符识别,把所有文本统一为可处理的纯文本格式,再用大语言模型对每一个段落做结构化抽取:这段话在说什么事件?涉及哪些人物?发生在什么时间?属于什么类型?原文关键句是什么?白话怎么翻译?
第二步,聚类。用大语言模型做跨朝代的模式匹配:这条记录和哪个韵脚最接近?如果不匹配任何已有韵脚,它是否和其他"无家可归"的记录构成一个新的聚类?有一部分韵脚是我预先锚定的——基于对中国史的基本认知,列出了一批"应该存在"的跨朝代模式。另有一部分是数据自己涌现出来的——大语言模型在处理过程中发现了我没有预设的模式,强行把它们推到了我面前。
第三步,综合。把数据还原为可读的历史叙事,同时交叉校验抽取结果的准确性。
我无意用这个流程来贬低传统学术。两周不到的时间买到的,是粗粒度的全景扫描,不是精细的考证。任何一个韵脚要写成经得起推敲的学术论文,仍然需要回到原始文献、需要专业学者的判断、需要大量的人工校对。但这个全景扫描本身——在很短的时间内把三千年正史的结构性模式全部铺开——是以前做不到的事。
这就像卫星地图和田野调查的关系。卫星地图不能替代田野调查,但它能告诉你哪里有山、哪里有河、哪里值得走一趟。
六、四个让我意外的发现
继承之危与缓冲之妙
秦始皇打下天下,二世而亡。胡亥即位时,赵高弄权、李斯附逆,三人组把帝国的方向盘直接拉断——从始皇驾崩到二世自杀,不过三年。隋文帝统一南北,杨广直接继位,大业十四年间修运河、征高丽、营东都,把父亲攒下的国力一口气烧光。王莽更极端:他自己既是创业者又是二代,新朝十五年就走完了从建制到崩塌的全程。这三个朝代的共同点不是"二代昏庸"——胡亥确实懦弱,但杨广精力充沛、王莽甚至是理想主义者——而是结构:开国者以铁腕锻造出一套全新制度,这套制度还没有来得及长出弹性,就被下一任的折腾拉断了。秦的郡县制、隋的科举和大运河,制度本身并不差,甚至被后来的朝代全盘继承。亡的不是制度,是节奏——建制太猛,转型太急,留给继承者的不是一个稳定的系统,而是一根绷到极限的弦。
但汉、唐、宋、明、清都挺过了"二代危机"。为什么?
答案藏在缓冲机制里。汉高祖死后,吕后专权十五年,这十五年看似是外戚乱政,实际上给新生的帝国提供了一段"低烈度运转"的过渡期。吕后死后,军功集团扶立文帝,三层过渡——高祖→吕后→文帝——让汉制有了喘息和生长的时间。唐的缓冲更血腥:玄武门之变是兄弟相残,但李世民贞观二十三年的稳定统治,给制度长出弹性提供了充足的时间窗口。宋太祖用兄终弟及避开了幼主风险,杯酒释兵权解除了武力威胁,韩琦、富弼、文彦博三朝元老的共治格局又为制度运转提供了人事上的连续性。明朝的缓冲更曲折:朱元璋在位三十一年,建文帝被推翻后,靖难者朱棣本身是开国元老级人物,永乐二十二年加上仁宣之治,制度得以稳固。清的缓冲最漫长:努尔哈赤→皇太极→多尔衮摄政→顺治→康熙在位六十一年,多代过渡加上议政王大臣会议的共治机制,让满洲政权从部落联盟平稳演化为帝国官僚体系。
这些缓冲机制的执行者——辅政者、摄政者、过渡期的实际掌权人——他们的个人命运却几乎都指向同一个结局。霍光辅昭帝,在世时权倾天下,死后不到两年,霍氏满门被诛。诸葛亮辅后主,鞠躬尽瘁,刘禅在世时不敢动他,但蜀汉的政治遗产在他死后迅速瓦解,后世翻案文章写了一千七百年。张居正十年新政,万历朝的财政和吏治为之一振,考成法让整个官僚系统重新运转起来——他生前是帝国的实际统治者,死后四天即被追夺官秩,抄家时家属饿死数人。多尔衮摄政七年,为清朝入关后的制度奠基立下首功,死后仅两个月,顺治帝下令掘其墓、削其爵、鞭其尸。
这些人都参与了缓冲机制,都在客观上帮助王朝挺过了最脆弱的过渡期。但作为个人,他们几乎都被清算。这是个人代价与制度收益之间的悖论:制度需要缓冲者,但制度成熟之后的第一件事,就是清除缓冲者留下的权力痕迹。
回到周公。周公被儒家奉为圣人,恰恰因为他做到了理想缓冲——既完成了过渡期的实际治理,又能干净退出。后来的辅政者多多少少做到了"缓冲"的功能,但作为个人很少能干净退出。儒家把这个唯一的例外当成了规范,这本身就是一个值得深思的韵脚。
核心洞见:亡的不是"有没有二代危机"——几乎每个王朝都有——而是"有没有为危机准备好缓冲"。制度会犒赏缓冲,但不会犒赏缓冲者。
变法者的三种结局,背后是同一种结构
商鞅变法,秦国由弱变强,二十年间从边陲小国跃升为战国霸主。商鞅本人的结局是车裂。王安石变法,开中国制度化改革的先河——青苗法、免役法、保甲法,每一项都试图用国家力量重新分配资源。变法失败,王安石罢相退居金陵,新法在他身后被逐条废除,但他开创的"以制度解决制度问题"的思路,影响了此后近千年的政治改革话语。张居正十年新政,万历朝的财政和吏治为之一振,考成法让整个官僚系统重新运转起来。张居正生前是帝国的实际统治者,死后四天即被清算。
三种结局——身死法存、法废人黜、生荣死辱——表面上截然不同,背后的共同结构却是一样的:变法者必须动既得利益者的蛋糕,而既得利益者的反扑,只是时间问题。变法能不能成,不取决于方案好不好,取决于变法者能不能活得比反对派的耐心更久。
文化吸收与反弹的钟摆
佛教自东汉传入中国,经魏晋南北朝的大规模传播,到唐代已深入国家肌理——寺院经济膨胀,僧尼人口激增,佛寺占有大量免税田产和劳动力。然后是反弹:北魏太武帝灭佛、北周武帝灭佛、唐武宗会昌灭佛、后周世宗灭佛,史称"三武一宗"。每一次灭佛的直接动因都是财政——寺院经济侵蚀了国家税基,但深层逻辑是文化消化不良:一种外来思想体系在本土扎根太深、膨胀太快,必然触发本土秩序的免疫反应。
这条韵脚不止出现在佛教身上。明末清初,耶稣会士带来的西学一度受到士大夫的热烈欢迎,徐光启、李之藻与利玛窦的合作是中西文化交流的高光时刻,随后是康熙朝的礼仪之争和雍正朝的全面禁教。清末西学再度涌入,洋务运动、戊戌变法、新政,每一波开放之后都伴随着国粹主义的反弹。文化越开放越要反弹,越反弹越酝酿下一轮开放。这个钟摆在三千年里从未停过。
草原-农耕的三百年节拍
匈奴之于汉,突厥之于唐,契丹、女真之于宋,蒙古之于元,满洲之于清。每隔约三百年,就有一次草原民族的整合与南下,每次都重塑中原的政治秩序。
这不是"游牧打农耕"那么简单。每一次南下的前提,是草原内部先完成一轮政治整合——冒顿单于统一匈奴各部,突厥可汗建立横跨中亚的政治体,成吉思汗把蒙古高原的散沙锻造成军事联盟,努尔哈赤用八旗制度把女真诸部编织成一个行政-军事一体化的组织。草原不是天然统一的,它的统一需要制度创新,而这种制度创新每隔几百年才完成一次结构性升级。升级完成之后,南下几乎是必然的——不是因为游牧民天生好战,而是因为新整合的政治体需要外部资源来维持内部凝聚力。
中原王朝的应对模式高度重复:先和亲或羁縻(用经济利益换取边境安宁),再边塞防御(长城、九边),再以夷制夷(扶植草原内部的反对派),最后在上述手段全部失效时被部分或全部征服。汉对匈奴如此,唐对突厥如此,宋对辽金如此,明对蒙古和满洲亦如此。每一轮的具体情节不同,但剧本的骨架几乎一致。
这条韵脚特别值得提出来,因为它不是中国独有的。罗马帝国面对日耳曼民族大迁徙,拜占庭面对塞尔柱突厥和奥斯曼,波斯萨珊王朝面对阿拉伯人的扩张——农耕帝国与草原/沙漠边缘游牧-半游牧民族之间的这种周期性互动,是欧亚大陆几千年历史中反复出现的结构性节拍。它自然地指向我下一阶段的计划:当世界史也被纳入同一套分析框架,这条韵脚会变得更加立体。
七、韵脚不预言未来,但提供参照
必须在这里划一条线。
韵脚不是预言。说"二代崩塌有结构性原因",不等于说"所有王朝都会二代而亡"。说"变法者的命运往往取决于既得利益者的反扑",不等于说"所有变法都会失败"。历史不重复,是因为情境永远是新的——技术在变,人口在变,国际格局在变,信息传播的速度在变。任何试图用历史韵脚做简单类比、对号入座的做法,都是对这个项目的误用。
历史押韵,是因为人性和制度的约束条件是有限的。人会嫉妒、会恐惧、会贪婪、会自欺,这些底层驱动力不随朝代更替而改变。制度会产生路径依赖、会被既得利益者锁定、会在解决旧问题的同时制造新问题,这些结构性约束也不随技术进步而消失。韵脚捕捉的,正是这些"不变量"在不同历史情境中的反复显影。
韵脚的真正功能是提供参照。当你读到某朝某代一位官员被流放到岭南,你的第一反应不再是"好惨",而是去查"流放与再起"这条韵脚——它会告诉你,流放在中国政治传统中不仅是惩罚,更是一种政治冷藏机制,被流放者在特定条件下有相当概率被召回重用。当你看到一场变法轰轰烈烈地展开,你不会急着判断它是好是坏,而是先问:这场变法的驱动力是什么?是财政危机倒逼的应急反应,还是意识形态僵化之后的路线修正?驱动力不同,变法的走向和结局就完全不同。
这是认识论意义上的解放。韵脚给你的不是答案,而是问题——更准确地说,是一套经过三千年验证的提问框架。有了这套框架,你读任何一段历史都不再是孤立的故事,而是一张巨大网络中的一个节点。你能看见它和哪些节点相连,能感知它在哪条因果链上震动。
见微知著,说的就是这件事。不是你变聪明了,是你有了参照系。
八、这只是开始
一百多个韵脚里,有的押得明显,有的隐微。这个阶段的计划是先挑其中一些精写,按公众号节奏每个周末推送一篇。一些已经在写或准备写的题目,预告几个:
- 党争是中国历史最高频的政治剧本——东汉到晚清五个朝代的同构
- 权臣与皇权的极限博弈:霍光、司马懿、鳌拜的三种结局
- 卸磨杀驴:开国功臣的两种命运
- 王朝晚期的四种死法:流民、藩镇、过度扩张、地方武装
- 知识分子的四种活法:投身、冷对、隐逸、流亡
- 夺嫡剧本:玄武门、靖难、九子夺嫡的共同结构
- 朝贡体系如何在十九世纪崩塌
- 思想异端管理史:从焚书到禁书
- 财政危机如何反复倒逼制度改革
这些写完之后,我的下一阶段野心是更大的工程——把世界史也纳入同一套流水线。罗马帝国从共和到帝制的演化、拜占庭千年的官僚化与神学纷争、奥斯曼的苏丹继承制与近卫军反噬、莫卧儿的统治精英与本土文化博弈、欧洲近代的宗教战争与民族国家成型、日本明治维新与昭和军部的循环……这些文明各有各的韵脚,更有意思的是它们之间的跨文明押韵。
到那时候才能真正回答:"哪些韵脚是中国独有,哪些是帝国通病。"
九、是为序
史可以为鉴,也可以为韵。鉴者照见兴亡的边界,韵者照见自己脚下的回响。
三千年的文字——从商代甲骨上的占卜到晚清奏折里的哀鸣,从周公旦的克己到多尔衮的掘墓,从赵高的指鹿为马到东林党人的慷慨赴死——这些故事不是死去的档案,它们是仍在震动的琴弦。你听不听得见,取决于你有没有一张琴谱。
这个项目试图提供的,就是那张琴谱。
三千年的押韵,今日始得通览。
是为序。
热门跟贴