3月25日,央视新闻发布“词元”相关专家解答。指出,“词元”是人工智能大模型为了高效处理数据,把数据进行拆分后的最小信息单元,可以理解为一个字,或是一个词,或是一个符号。在人工智能时代,用户输入的每一个字,大模型生成的每一段话、识别的每一幅图像,都在消耗词元。国家数据局相关负责人介绍,到今年3月,我国日均Token(词元)的调用量已经超过了140万亿。
国家数据局专家咨询委员会委员张向宏:日均超140万亿的词元调用量,相当于1000万亿个中文词汇,也相当于250个中国国家图书馆的资源量。
国家发展改革委国家信息中心人工智能处工程师 蔡驰宇:词元日均调用量大幅增长,充分表明人工智能正加速从实验室走向千行百业和千家万户,变成了实实在在的生产力工具,像水、电、网络一样,成为智能社会运转的基础资源。词元的消耗量是人工智能产业发展的重要指标和“晴雨表”。
作为新生事物的词元,也在催生新的机遇。国家数据局负责人表示,以词元计费为基础的新型商业逻辑正在加速演进。
据了解,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业可能变现的重要路径。
蔡驰宇:过去,一家企业使用信息服务,就得购买信息软件,那是一次性购买软件的价格;现在一家企业同样是使用信息服务,它可能直接调用的是大模型的接口,用多少词元,就付多少费用,以词元消耗量的多少作为计费的依据。
与此同时,专家表示,词元消耗量增长也对电力资源提出了更高需求。今年的政府工作报告中提出,实施算电协同等新基建工程。
张向宏:算电协同的本质含义,就是要使用我们国家具有超前优势的绿电来发展我们的算力产业和人工智能产业。
热门跟贴