作者 | 由仪
编辑 | 葛覃
过去半年,AI云的牌桌上似乎只剩下一种声音:Token。
Token单位价格的下限不断刷新,日均Token调用量不断突破峰值,几乎每家云计算或模型厂商的财报会上,都会大谈特谈Token消耗量或者MaaS收入,仿佛Token规模可以换算成AI云的竞争力。
在6月5日举行的华为云INSPIRE创想者大会上,华为公司董事、华为云CEO周跃峰就任以来的第一次大型媒体见面会,便直接把另一种立场摆到了桌面上。
他表示,华为云不太在乎Token总量是多少,在当前国产化算力正在成长的情况下,也不太在乎收入的总量是多少,他更愿意看的,是每一个Token给生产力、给生活水平真正带来多大的价值。
当然了,说归说,行业内外真正关注的是,华为云是被迫转向,还是主动选择了另一条赛道?
梳理华为云的战略转向,首先要看清华为云整个结构,底层是以昇腾、鲲鹏为代表的国产芯片算力,上层是一个个难啃的行业场景解决方案,包括医疗、制造等,中间厚厚的一层负责把硬件的"算力"翻译成场景的"生产力",也就是华为云最新提出的Agentic Infra相关产品和能力。
由此看出,华为云的骨架和肌理本就和其他云厂商不同,以Token为中心的叙事试图把复杂的B端生意,简化为标准的单一指标,这符合互联网云厂商的熟悉打法,先打透价格、做大规模,再用流量喂养下一轮迭代。
有意思的是,在海外的硅谷,Tokenmaxxxing火爆了六个月之后,同样开始出现另一种声音——Tokenpocalypse。
Tokenmaxxxing指的是用尽一切手段,尽可能多地使用Token,Token+Apocalypse,字面上是"Token的末日",隐含意义是Token正在大幅贬值,调用量曲线一路上扬,可真正能沉淀下来的结果、能复用的场景资产,并没有跟着同步往上走。
行业里更多人意识到,大家其实是在用一种越发越多、却越来越不值钱的货币,去支撑一份看上去越来越大、实则越来越薄的生意。
Token本身不再重要,重要的是Token背后代表的每一分价值,华为云先于绝大多数厂商走上了这条路,既有现实条件的约束,也是主动找寻的出路。
用另一种养料,堆出的硅基黑土地
理解华为云的最好入口,是周跃峰反复提到的那个词——"硅基黑土地"。
在他的定义里,这片黑土地最难被模仿的第一层,正是底层算力。鲲鹏负责通算、昇腾负责智算,操作系统欧拉、智算软件栈CANN全部开源开放,构成了一整套全国产化的算力硬件系统,今天华为云上跑起来的每一个Token,背后都是这套国产硅基在支撑。
这条路走得并不轻松,周跃峰自己也承认,华为公司因为没有办法用别人的算力,只能努力让自己的算力持续进步,再凭借实打实的效果赢得商业上的认可。
华为云没有捷径可走,每一次性能提升都得自己往上垒。本次大会发布的AICS灵衢智算集群,就是这种"垒"的最新成果:10万卡级集群规模,总算力200 EFLOPS,Token生成时延压到10毫秒以内,千卡每秒吞吐500万Tokens,在线服务可用性99.95%。
放到行业对照里看,区别就更清晰,别人家的算力底座是"万国牌",可以用英伟达以及海外其他厂商的GPU和网络方案,,华为云这片黑土地,只能用国产硅基“泥土”一寸一寸往上堆,没有第二个选项。
周跃峰也表示,自己没有办法构建万国牌的硅基黑土地,这正是华为云和别的云公司根本性的不同,也是他不愿意去比收入、比规模名次的原因,因为对华为云来说那种比较没有意义。
在AI卡资源全球紧张、国产化算力正在成长的情况下,他不打算参加Token总量竞赛,反而把它重新定义为另一件事,发展第二个算力平面,让AI有更多的技术路线和生态可以选择。
这是华为云和这一轮AI云竞赛里其他玩家最根本的分歧,别人是在"现有的最优解"上做规模优化,华为云是在为整个产业撑起一条算力路径。华为公司最近发布的"韬定律"也是这一理念的体现,半导体产业基础每往前一步,华为云的硅基黑土地才能再厚一寸。
"硅基黑土地足够的肥沃,才能够长出更多的庄稼和参天大树。"周跃峰提到,它指的不是商业故事,是AI产业物理意义上的"地基"。
把算力翻译成生产力,需要做什么
如果说底层是土地、上层是庄稼,那中间这一层就是把水、肥、根系连起来的土壤结构。它不显眼,但决定了整片地能不能真的长出东西。
华为云一次性发布了多款AI产品,它要解决一个核心问题,底层自己一点点堆出来的国产硅基,怎么才能被上层成百上千个行业场景顺畅地用起来。
大模型仍然飞速迭代,算力在指数级膨胀,在周跃峰看来,今天大多数企业自建AI系统的方式注定是被动的,很可能部署完就已经落后了,华为云希望把这种"快"消化掉,让上层不用感知底层的复杂。
例如,CCE Volcano Next通智一体化调度引擎,通过训推共池、碎片整合把通算和智算混在一起调度,资源利用率提升30%以上。新一代ModelArts Next把RL强化学习、机密推理、模型路由、模型矩阵打包成一组能力。
值得强调的是,华为云在中间层做的另一个选择——开放,能开源的尽量开源,能解耦的尽量解耦,让更多伙伴接入做大国产AI生态。
MaaS模型路由已经接入15余款SOTA模型,调度精准率超过95%,调用成本平均降低20%,让企业不需要懂底层算力的脾气,就能让大模型"越用越聪明"。再上面一层,是面向智能体的AgentSphere运行底座、智果(AgentArts)企业级智能体平台,以及开源版openJiuwen,把门槛降到最低。
周跃峰用"翻译器"来形容码道(CodeArts)的那句话,其实可以推广到整个中间层——它的价值不在于自己有多厚,而在于能不能让上面的人和下面的硅基真正对话起来。
某种程度上,华为云必须做到足够开放,才能让更多人对国产AI云这一条路径抱有信心,开放到让客户不必担心锁定,开放到让开发者敢于把自己的能力沉淀进来,开放到让整个生态愿意陪着这片黑土地一起把厚度往上加。
华为云可能是AI时代最开放的云。
去行业里,找那种换不掉的Token
虽然Token经济火热,但是行业公认,Token的粘性比较差,标准化的Token是商品,用户随时会被低价吸引走。对模型或者云厂商来说,要么始终让自己的Token价格最低,要么找到那些不容易被替换的Token场景。
华为云的选择,显然是后者。行业AI梦工厂专区,就是华为云找到的答案,智慧医疗、具身智能、智能制造、科学计算,华为云一次性宣布上线四个专区。
周跃峰表示,AI面向行业深耕,要比toC或者通过APP给个人带来情绪价值难得多,需要更多的耐心和更多的投入。但越难的事,护城河越深。一旦客户的核心业务跑在某个行业专区里,它共享专属的数据集、原子能力、合作伙伴生态,这部分Token就不再是商品意义上的Token,而是嵌进客户业务流程里的一部分生产力。
智慧医疗专区是目前较为成熟的样本,全中国看切片的病理医生只有两万多名,远远不够,绝大多数县域和地市级医院不足以做好病理诊断,很多偏远医院由于经验不足,病理误诊率较高。
瑞金医院联合华为共建的RuiPath大模型沉淀了瑞金大量专家和医生的医疗经验,包括上海瑞金、邯郸市中心医院、河北工程大学附属医院、瑞安市人民医院、黔西南州兴义市人民医院、武安市第一人民医院等20余家医院正式入驻,其中很多是过去技术红利够不到的非三甲医院。
患者不再需要跑到上海排队挂号,远程就能共享高水准的医疗能力。在这个场景里,每一个Token背后,都是一份病理报告、一次确诊,和被多争取出来的时间。
具身智能专区瞄准的是另一个结构性问题,全国300多家具身智能创业公司,绝大多数没有能力自建从数据合成、模型训练、仿真验证到部署的整套工具链。
华为云这次发布的CloudRobo,是全球第一个全流程具身智能开发平台,直接搭在公有云上,中小创业公司只需要付很少的算力费用,就可以在专区里共享数据、模型、仿真和案例。
这些专区的共同点是,Token被嵌进一条具体的行业流水线里,粘性高、可替代性低、价值密度大,每一个Token的背后,都是一次生产效率的提升,是企业能从AI中获得的实实在在的回报。
把三层放在一起看,华为云这一轮的战略格外清晰,它没有用万国牌的硅基去和友商比谁的Token更便宜、谁的调用量更高,而是一头扎进国产硅基的笨功夫里,把"黑土地"一寸一寸堆出来,又在上面一头扎进具体的行业里,去找那些真正能"解难题"的Token场景,中间一层,是把这两端紧密连接的完整链路。
这是一种现阶段很容易被低估、也很难被复制的打法,但预计会成为更多云厂商下半年的叙事。
Token的战争,华为云不打,它在打另一场战争,让每一个Token都长在能够创造生产力的行业土壤里。
The End
热门跟贴