理查德·西尔斯,七十五岁,美国人,学中文五十多年,系统整理汉字字源三十多年。中国网友给他起了个亲切的外号——"汉字叔叔"。
西尔斯曾在公开访谈中表达过类似观点:汉字是全球唯一超越时空的文字,这一优势超过英法俄语。一个老美下这么个判断,怪不怪?
其实一点不怪。放眼整个语言学圈,能把数据掰开揉碎讲清楚这件事的人不多,而他恰恰是其中之一。
要理解这句"汉字是全球唯一超越时空的文字"为什么能站得住脚,得绕一个弯,看看其他主要语言这些年都在干什么。
法国人最焦虑。法兰西学院四十名院士每年大量精力花在一件事上——挡住英语词汇的"入侵"。Email不能用,要叫courriel;hashtag不能用,要叫mot-dièse。
立法层面也跟上了,公共广播必须用法语外来词译名。俄罗斯也好不到哪儿去。苏联解体后,俄语在中亚、波罗的海一路退守。
哈萨克斯坦干脆把官方文字从西里尔字母改成拉丁字母,等于把祖父辈写的东西,让孙辈彻底读不懂。英语看上去最强势,但它内部的分化早已无法收拾。
印度英语、新加坡英语、加勒比英语,发音、拼写、习惯用法,几乎是平行宇宙。语言学家半开玩笑说,再过几百年,这些"英语"可能像当年的拉丁语一样,分裂成一堆听不懂彼此的方言。
拼音文字的共同软肋只有一个——它绑死在声音上。声音是这世界上最不稳定的东西。三十年一变,三百年面目全非。
文字跟着声音跑,跑着跑着就跟祖先告别了。英语母语者今天读莎士比亚要看注释,读乔叟基本得当外语啃。
再往前推一千年,盎格鲁-撒克逊时代的英文,对现代英国人来说就是天书。汉字走的是另一套逻辑。汉字不完全依附语音,兼具表意、表音和构形记忆功能。
声音漂移没关系,字形微调没关系,"日""月""山""水"这些核心字眼里的画面感,三千年没变。殷商时代的中国人在龟甲上刻字记录占卜结果,今天的小学生在课本上认识同一批字根。
这种事在地球上任何其他文明里都属于神话。古埃及的圣书体,断了;古巴比伦的楔形文字,断了;玛雅人的图形文字,断了;印度河流域的印章文字,至今没人能完全破译。
只有汉字活了下来,而且还活得很好。这就是西尔斯说"超越时空"四个字的底气。不过我想往深里再挖一层。
汉字这套系统对当下的国际关系格局意味着什么?这才是真正值得讨论的问题。先看一个反例。
1970年代,韩国全面去汉字化。结果呢?
年轻一代基本读不了本国的史料原文,法律文献里大量同音异义的汉字词成了灾难——光"수상"一个发音,可以是"首相""授赏""殊常""水上""受赏""手相"六个意思。律师写合同要附注汉字,老一辈说看不懂年轻人写的报告。
越南更彻底,二十世纪初就把汉字换成了拉丁化的"国语字"。今天的越南人看自己国家明清以前的史书,必须靠专家翻译。
一个民族被生生切断和自己历史的连接,代价是不可估量的。反观日本,至今坚持在小学、初中阶段教授两千多个常用汉字。
日本文部科学省的统计显示,会汉字的日本人,对古文的理解能力明显高出一个档次。日本媒体上汉字使用率仍占报纸文本的三成以上。
这套底层逻辑,在AI时代被放大了,而且是被指数级放大。斯坦福大学人工智能研究所2026年4月发布的《人工智能指数报告》给出了一个让很多人意外的结论。
中美AI模型性能差距已基本消失,截至2026年3月,美国顶尖模型仅领先中国模型2.7%。这是个什么概念?
要知道,2025年美国AI私人投资达到2859亿美元,是中国124亿美元的23倍以上。23倍的钱差距,换来2.7%的模型差距。
这笔账不正常。不正常背后一定有不正常的原因。原因之一,就是中文语料本身的"信息密度"。
英语训练一个大模型,要喂海量的token;同样意思的中文,token数量大幅压缩。同样的算力,中文模型能"吃"进去更多有效信息。
这个优势叠加几亿次训练,差别就出来了。DeepSeek、Qwen、豆包这些国产大模型能用"白菜价"的算力,跑出对标顶级闭源模型的成绩,这套语言学先天优势是底牌之一。
在前20的AI机构中,中国11家超过美国位居首位。阿里巴巴位列2025年全球顶级模型贡献榜第三名。这个排名一年前还不可想象。
中国在论文发表数量、论文被引频次、专利产出总量以及工业机器人安装量等多项指标上已占据优势。这是西方主流研究机构给出的客观判断。
为什么"超越时空"这四个字此刻特别值得拿出来说?因为国际竞争已经走到了一个新阶段。
硬实力的较量,肉眼可见;软实力的较量,藏在水下。语言、文字、文化符号,正在悄悄重塑全球的认知格局。
冷战结束后,英语顺着美国的政治、经济、科技扩张,统治了三十多年。但语言霸权和综合国力强相关,国力一旦松动,语言地位就开始动摇。
法国的衰退带动法语在国际组织里的份额一路缩水;苏联解体之后俄语在中亚的退潮谁都看得见;西班牙语虽然使用人口庞大,但停留在拉美和伊比利亚半岛,难以突破文化圈层。中文不一样。
中文背后是一个连续五千年没断过线的文明体系。它的扩散不靠殖民史,不靠传教士,更多依赖的是当代中国的综合吸引力——经济体量、产业链能力、科技突破、文化产品输出。
非洲就是一个鲜活的样本。中非合作论坛之下,中文教育在多国国民教育体系里扎根。
肯尼亚、南非、埃及、坦桑尼亚的中学生学中文,已经从"选修猎奇"变成"职业刚需"。一个会中文的非洲青年,找工作的机会、薪资水平,跟同龄人差距可能拉到两倍以上。
东南亚的情况更直接。RCEP生效之后,中文成了区域内最重要的商务语言之一。马来西亚、印尼、泰国的华文学校,报名人数年年创新高。
中亚五国跟着"一带一路"的节奏,孔子学院和中文课堂的覆盖密度大幅提升。哈萨克斯坦的不少大学,中文专业的录取分已经超过英语专业。
中东也不能忽视。沙特2019年就把中文纳入中小学课程。阿联酋、卡塔尔紧随其后。
海湾国家的精英阶层意识到,未来三十年的能源贸易、基建项目、投资伙伴,绕不开中国。欧洲航天员主动学中文,为的是有一天能登上中国空间站。
中国在工业机器人安装量上的领先优势极为明显,2024年中国安装29.5万台,占全球54%。当一个国家在硬件和软件两端都走在前沿,它的语言被世界主动学习,几乎是必然结果。
需要特别说一下台湾地区。海峡两岸虽然在某些字形上有简繁差异,但文字内核完全一致。
台湾地区的同胞翻开《史记》《资治通鉴》《唐诗三百首》,读的是和大陆同胞一模一样的文化母体。这种文化共同体的根基,是任何外部势力都切不断的。
所以当西尔斯说出"汉字是全球唯一超越时空的文字,这一优势超过英法俄语"这句话的时候,他不只是在做一个语言学判断,他实际上是在描述一种正在发生的国际格局变化。文字的稳定性,对应着文明的持续性。
文明的持续性,对应着文化自信的厚度。文化自信的厚度,对应着国际博弈中的战略耐心。
中国在很多议题上能够"以静制动",能够拒绝跟着西方的节奏走,背后有一整套支撑——这套支撑里,汉字这个看起来最不起眼的元素,恰恰是最坚硬的那一块。有人可能会问,这是不是有点"文化自夸"?
恰恰相反,我认为我们对汉字的认知,这些年还是太轻了。我们习惯了在键盘上敲拼音,习惯了让输入法替我们想字,习惯了把汉字当作日常工具。
我们很少停下来想一想,全世界为什么只有我们这个文明,能让一个普通中学生读懂三千年前的卜辞片段。这件事在全球语言学版图上是孤例。
不是"罕见",不是"少有",是孤例。世界上其他古老文明,要么文字断了,要么民族散了,要么国家亡了。
汉字之所以能活到今天,背后是数十代中国人对文化的死磕——从秦始皇统一文字,到许慎写《说文解字》,到段玉裁注《说文》,到甲骨文的发现和释读,到二十世纪扫盲运动,到信息时代的字符编码标准化。每一代人都在传递这套代码,没人敢让它断在自己手里。
也正因此,今天我们才能在AI时代,把汉字这个老古董变成最锋利的武器之一。中文语料喂出来的大模型,理解成语、典故、双关、谐音的能力,远远超过英文模型理解中文的能力。
中文写出来的合同、技术文档、外交照会,往往比英文版更短、更精确、更难产生歧义。中文承载的文化产品——古装剧、网文、短视频、游戏——正在以每年几十亿美元的规模出海。
外网上的中文内容,已经成了主要流量入口之一。回头看西尔斯的话,他用"超越时空"四个字给汉字下了一个定义。
这个定义不是夸张,不是煽情,不是民族主义情绪的产物。它是一个外国学者,用五十年时间,用九万多个古汉字字形,用上百场跨国比较研究,给出的冷静结论。
英法俄三种语言再厉害,它们处理"过去"的能力远不如汉字;它们处理"未来"——也就是AI时代的信息压缩需求——同样远不如汉字。这是结构性的差距,不是努力就能追上的。
国际关系研究者经常讨论一个问题:什么样的国家能笑到最后?答案有很多,国力、制度、地理、人口、技术。
但在我看来,最容易被低估的一个变量是"文明的语言载体是否还活着"。古希腊文明伟大,但古希腊语死了;古罗马帝国伟大,但拉丁语死了;古埃及文明伟大,但圣书体死了。
这些文明的当代继承者,已经无法直接和自己的祖先对话。中华文明能直接对话。这种"对话能力",意味着我们的战略思维拥有更深的纵深。
两千年前韩非子写的东西,今天的官员、学者、企业家可以直接读、直接用、直接借鉴。这是其他文明不具备的奢侈品。
理查德·西尔斯一个外国人都看明白的事情,我们自己人没理由看不明白。汉字这套五千年前就写好的底层代码,经过无数轮"系统升级",内核纹丝不动。
它不只是文化遗产,更是当下的生产力,是未来的核心竞争力。在英语、法语、俄语忙着给自己打"补丁"的时候,汉字依然稳稳跑在那条从殷商一路通向AI时代的高速公路上。
这条路的尽头是什么,没人完全说得清。但可以肯定的是,谁掌握了这套最高效的信息系统,谁就拥有了在下一轮全球竞争中的关键筹码。
热门跟贴