图片系AI生成
AI快节奏的变化,已然打破原有产业链的运行方式,从芯片、基础设施,再到模型和应用,产品的设计逻辑已被改写。Token经济下,AI正从工具应用走向生产要素,算力也随之从资源供给升级为面向Token生产的系统能力。
爆发式的需求让Token工厂成为资本和产业界追捧的热点,亦是今年产业发力的关键点。整个产业正在进入由“能力竞争”迈向“生产范式竞争”的新阶段,对算力规模、效率与能效提出了更高要求。
对于算力基础设施服务商来说,走了几十年的 “稳态” 路线成了过去式,需要将分散、复杂的AI能力转化为标准化、规模化的生产能力,为客户提供面向未来的企业AI解决方案。
正如国际核能院院士、中国人工智能学会会士张勤所说:“随着AI从语言理解迈向对物理世界的认知与交互,算力基础设施也必须从单点供给升级为算力、网络与能源协同的系统性底座,才能真正支撑智能应用的规模化落地。”
只是,Token经济听起来很美,真正要跑通,不只是在算力层,在应用层、模型层等都还有无数的坑需要填。
算力产品底层逻辑已经改写
Token正在彻底重构算力世界,成为中国AI产业的核心“货币”。据相关机构预测,2026年中国整体Token调用量将达日均306.3万亿,2030年有望达到19306万亿,2025至2030年复合增长率高达210%。而在Token经济的“冲击”下,算力基础设施的底层逻辑也在被彻底改写。
过去,在AI没有真正火起来之前,服务器产品还是集中在通用计算和超算,那时候做产品规划更多是以追随上游厂商的CPU路线为主。而芯片的路线图一般在三五年之内都很清晰,不会有较大的变动,因此基础设施产品的定义是一个“稳态”的模式,可以把未来三年、五年一起都规划了。
不仅如此,当初的设计出发点就是要量产,需要适配所有的CPU、各种型号的SSD、HHD等,中间还要不断的验证,因为要保证产品在客户端每一个配置都不会出问题。并且,所有客户的需求要摸清楚,各种成本要摸清楚,确保产品一上市就是一个爆款。
但AI时代到来后,一切都变了,整个产品的路线出现了一些不确定性,特别是GPU,可能产品还没有来得及上市,就已经过时了。
“等你摸清楚所有市场的需求,你摸清楚的那些可能已经变了。”联想中国基础设施业务群服务器事业部总经理周韬指出,模型、应用的层面更新更加快,当我们发现DeepSeek可以搞一体机,刚搞出来,好像就已经过时了。今年年初龙虾火了,但最近好像也不是那么热了。
这时,如果还沿用稳态模式跟跑,只会永远慢市场半拍,算力产品的研发逻辑正在全面转向敏态。所谓敏态,核心就是放弃“全量适配、一步量产”的传统思路。
现如今,客户要的配置可能相对特别单一,没有那么复杂,不用把所有想得到的都进行交叉验证,快速迭代最好是让客户去看哪个是他真正需要的,快速形成一个产品,送测之后,客户觉得不错再把它转为量产的产品。
“这样可以把原来从18个月,甚至更长演化、规划的时间,缩短到几个月的时间,投资的成本也会降低很多。原来一年的研发预算只能投两三个产品,现在这种敏捷的模式,我就能投10个产品、15个产品,并不需要每一个投的产品最后都成功,可能投了10个,有三四个成功就行了。”周韬说道。
在这套逻辑下,联想问天也改变了原有的产品规划模式,并新推出万全异构智算平台V5.0、超节点解决方案,提出到2027年联想中国基础设施群要做到1000亿元的业绩目标,推动算力基础设施从“资源支撑载体”向“词元生产系统”转变。
周韬表示:“我们的目标,是让客户以更高效率、更低成本实现AI规模化应用,让算力从资源供给真正转化为可交付、可扩展、可持续的生产能力。”
Token工厂,还有无数的坑要填
产品研发逻辑的迭代,只是AI时代下变化的第一步。联想问天在做的,一个是通过AI工厂、超智融合算力与全栈产品体系,将分散、复杂的AI能力转化为标准化、规模化的生产能力;另外一个,则是通过构建高性能、低成本、可持续的基础设施底座,为客户提供面向未来的企业AI解决方案。
不过,推动算力从资源供给走向价值生产,当行业真正试图把算力中心变成“Token工厂”,才会发现,面前还有很多坑要去填。
其中,计算系统就需要六大工艺去填补,每一项都是决定Token成本与效率的关键。比如计算调优工艺、缓存的工艺。缓存是目前国产卡做推理最大的瓶颈,需要进一步做好KVcache命中以及缓存的量化。谷歌的相关技术论文曾引发存储板块股价大幅波动,足见缓存优化对Token效率的影响力,也是当前国内算力厂商必须啃下的硬骨头。
除此之外,在计算层面,还要做好容错、用电、通信以及能耗的工艺等。这些工艺的差距,也正是为什么同样的GPU配置,不同厂商的集群跑出的Token吞吐量天差地别的原因。
而在填完计算这个坑后,还有数据治理、能效管理、安全合规、运维管理等短板需要解决。联想中国基础设施业务群战略总监黄山透露,在安全层面,正在与火山合作,因为全中国被攻击最狠的是豆包。“现在的测试版本到了第二版,接近满意,我希望第三轮之后,在7月份把它发到市场,目标是能达到火山在公有云防豆包攻击测试水平。”
需要指出的是,对于整个Token经济来说,算力基础设施解决不了所有的卡点。黄山坦言,即便把数据、计算、安全、能效这些坑都填平,也只是能经营好一个AIDC,卖Token而已,这个时候AI应用落地会怎样?模型有没有选对?智能体做的好不好?架构、算力在AIDC之上还有几个卡点。
简单来说,上层应用不成熟,对Token的需求就起不来,算力投资难以收回成本。Token成本居高不下,企业就不敢大规模投入应用创新,场景就永远跑不出来。
“好在全世界那么多的大咖下了很大的决心往里面使劲砸钱,我们希望这些钱能够用到对的技术上。”黄山说道。(文 | 志读科技,作者 | 杜志强)
热门跟贴