新京报贝壳财经讯(记者韦英姿)3月18日,清华大学校务委员会副主任、清华大学可持续社会价值研究院院长杨斌发文强调,提议将“Token ”这一定义AI时代的核心度量单位译为“模元”,用以区别于区块链、网络安全等其他场景中的Token译名。

“AI大模型领域的Token也曾有过多种中文译名,但推敲下来,发现都无法匹配AI大模型、智能体时代的核心内涵,难以打破大众的认知壁垒。”杨斌解释称,比如,“词元”被“词”字锁死在文本场景,无法适配多模态、物理AI的应用形态;“语元”囿于语言范畴,窄化了Token作为模型通用处理单元的本质;“义节”过度聚焦语义,忽略了Token纯特征、结构化处理的属性;而“托肯”“屯”等单纯音译,徒有其音、缺乏实义,普遍接受度低,还会加重非专业人群的理解负担。

Token已经成为当前AI产业常用计量单位。杨斌提出,当一个核心且被高频使用的技术名词成为万亿级产业的核心标尺,其中文定名便不再是无关紧要的细节,而是关乎产业共识形成、技术普惠落地、公众认知普及的刚需。

校对 卢茜