AI领域绕不开的词——Token,中文译名终于官宣了。这件事的意义,可能比人们想象得更加深远。
近日,国家数据局局长刘烈宏在中国发展高层论坛年会上,使用“词元”指代人工智能领域中的“Token”一词。Token是模型处理信息的最小计量单位,小到一次AI提问,大到企业级模型训练,都以其完成结算。Token调用量越高,说明AI模型活跃度和产业价值越高。
也就是说,在AI时代,Token已经是兼具信息单位、算力单位和货币单位三重属性的核心经济标尺。到今年3月,我国日均Token调用量超过140万亿,较2024年初增长了1000多倍,反映的正是中国AI产业迅猛发展之势。
有网友觉得,Token叫得顺口,似乎没有必要再造中文译名。但如此重要的概念,在中文世界却长期缺乏统一、精准的翻译,其英文原文在不同场景下也有“代币”“令牌”等多个语义。歧义带来的混乱,给技术讨论、政策制定和公众认知都带来了不小的障碍。及时推出一个权威译名,有助于推动AI技术在中国更好更广泛地发展、普及和应用。
更进一步地看,技术发展史上,一个技术名称往往对应着技术生态的国际话语权和规则制定权。我国在技术跟跑阶段时,对计算机、互联网等外来技术尚且要做本土化转译。而在人工智能时代,我国已经处于领跑的第一梯队,中央也多次强调要牢牢掌握人工智能发展和治理主动权——为关键核心概念赋予一个“中国名字”,无疑是必须直面的时代课题。
因而,不论“词元”一词精准与否、行业接受度和长期生命力如何,“命名”这件事本身就有相当深远的意义。不久前人民日报发起“为AI征集更顺口中文名”的倡议,也折射了相近的思路。它们引发的公共讨论,正是凝聚共识的契机与过程。
但同样要认识到,“命名”虽关键,也只是话语权构建的基础一环。与实质性的标准制定权、技术路线主导权、生态治理权之间,仍存在巨大的鸿沟。我国AI行业在应用领域领先优势明显,但要真正掌握“解释权”与“定价权”,仍面临诸多挑战。
仍拿Token来说,这些AI领域的底层概念之所以在行业间约定俗成地使用英语叫法,主要是因为它们最早由说英语的研发者定义并使用。
我国AI产业后来居上,一边将“Token们”本土化,一边也要在基础研发方面继续发力,尽可能地自主创造一些未来发展绕不开的核心概念与工具。当更多基础理论、关键核心技术在中国的实验室里诞生,当更多国产AI框架与开源项目成为全球开发者的事实选择,定义权和影响力高地自然会逐步转移。
这还需要治理框架和国际合作的共同支撑。在大国竞争升级、人工智能治理分化加剧的背景下,能否构建起前瞻、敏捷、包容的治理框架,能否顺利衔接国际通行叙事,考验的是行业内外多维度综合实力。
随着中国AI发展范式走出“拼效率”的差异化道路、国产AI应用在海外占领更多市场、我国主导的人工智能国际合作广泛开展,各项支撑要素越来越扎实、多元、成体系,更多“中国命名”将成为世界通行语汇。
从这个角度看,“Token”变成“词元”,或许代表着中国领跑AI征程上又一个具有标志性意义的新起点。
原标题:《上观时评 | Token变“词元”,折射AI命名权和话语权之争》
栏目主编:简工博 题图来源:上观题图
来源:作者:解放日报 胡幸阳
热门跟贴