打开网易新闻 查看精彩图片

天津举行的2026世界智能产业博览会落幕,“Token焦虑”成为展馆内外最热的话题。算力供给碎片化、生态协同不足、应用转化周期长,这些问题让手握算力的企业依然“心慌”。但在光合组织的展台上,我们看到了系统性破解这一焦虑的清晰路径——“开放计算Token谱系”。

这套由光合组织联合6000余家生态伙伴共同打造的体系,并非简单的硬件堆砌,而是一套从芯片到应用的全链路效率方案。其中,作为核心芯片提供方的海光信息,其角色尤为关键。

双芯协同,不只是“1+1”

过去几年,国产算力的叙事往往围绕“替代”展开:用国产CPU替代Intel/AMD,用国产DCU替代NVIDIA。但海光的思路显然更进一步,它不只是在做单品替代,而是在构建一套面向Token全生命周期的协同底座。

先看CPU端。海光C86完全兼容x86生态,这听起来是个“老故事”,但在Token时代,兼容性的价值被重新估量。大量行业用户——金融、政务、能源,已经沉淀了数十年的x86软件资产和业务流程。如果底层芯片无法兼容,企业就需要承担昂贵的重构成本,而这些成本最终都会转化为Token的隐性成本。海光的选择,本质上是在帮助企业“零摩擦”地进入AI时代,而非让其推倒重来。

再看DCU端。配套自研的DTK工具栈,DCU可实现CUDA代码的无缝迁移,全面适配PyTorch、TensorFlow等主流框架。这意味着,开发者不必为国产芯片重写模型,现有的AI应用可以快速跑在海光底座上。实测显示,通过底层API的深度映射与软硬协同优化,跨平台迁移中的算力损耗已大幅降低。

这种“CPU兼容生态、DCU平滑迁移”的双芯策略,解决的是Token时代最棘手的一个问题:流转效率。Token只有在不同系统、不同框架、不同场景之间高效流动,才能避免被“困死”在单一环境中。其双芯底座,恰恰为Token的跨平台流通铺平了道路。

稳定与安全,Token价值的“隐形护城河”

如果说兼容性解决的是Token“能不能跑”的问题,那么稳定性和安全性,决定的是Token能不能持续跑、能不能放心跑。

在大模型训练和推理的高负载场景下,任何微小的系统波动都可能导致Token生产中断。海光DCU集群已能支撑万亿乃至十万亿参数模型的训练,并在MLPerf等测试中表现不俗。更重要的是,其强调从芯片定义阶段就进行软硬深度耦合,而非后期打补丁。这种“原生设计”思维,让系统在高密度Token生产下依然保持稳定。

安全层面,海光将国密算法、可信计算、机密计算等能力下沉至芯片底层,使安全不再是“外挂防火墙”,而是算力的原生属性。当AI深入金融风控、政务专网、医疗数据等高敏感场景时,这种“内生安全”能力,恰恰是Token能够实现高价值转化的信任基石。

可以见得,国产算力的突破,未必需要另起炉灶、彻底颠覆。在兼容中求创新,在协同中提效率,在安全中筑壁垒——这或许是一条更务实、也更能支撑大规模产业落地的路径。

展会现场,海光还透露了其向边端算力外延的布局。但无论算力形态如何演变,CPU+DCU这套“双芯”组合,都将是其贯穿云、边、端的核心基石。Token时代的答案,或许就藏在这套底座里。

The End