为什么我们需要芯片架构主权?

打开网易新闻 查看精彩图片

说起芯片架构,我们可以把它比作软硬件之间的 “通用语言”:软件下指令,硬件按规则执行。如今全球芯片市场,被 x86 和 ARM 两门 “语言” 统治:x86 扎根 PC 和服务器数十年,历史包袱成了生态护城河,英特尔和 AMD 的自留地几乎没有后来者的空间;

ARM 靠低功耗起家,从手机延伸到汽车、数据中心,但本质上是 “买房而非买地”—— 用户可以拿到 IP 授权,但不能改动底层架构,相当于只能装修不能砸承重墙。

几年前 ARM 与高通的授权纠纷,表面是合同争议,深层其实是专有架构的命脉问题:即便你有顶尖设计能力,底层规则依然握在别人手里。这就是芯片架构主权的由来:我们需要的不是 “能买到芯片”,而是 “能决定芯片底层规则”。

打开网易新闻 查看精彩图片

2008 年,加州伯克利的学者提出了 RISC-V,目标就是做芯片界的 Linux:任何人都能使用、修改、扩展,无需缴纳巨额授权费。但很长一段时间里,RISC-V 都只能在嵌入式、物联网等低端领域 “打杂”,被当成低端平替的刻板印象根深蒂固。

玄铁 C950:把 RISC-V 拉进高性能俱乐部

玄铁 C950,彻底打破了这种刻板印象。官方数据显示,它在 5 纳米工艺下主频可达 3.2GHz,SPEC 跑分达到 22 分每 GHz,总分突破 70,比肩英特尔至强三代产品,超过了 Sierra。

达摩院首席科学家孟建毅博士曾透露,研发过程中最核心的两点是微架构创新软硬件协同优化:既要提升发射宽度等核心性能指标,又要严格控制功耗和成本;同时打磨编译器、底层库,让软硬件配合发挥最大效率。

打开网易新闻 查看精彩图片

更关键的是,玄铁 C950 采用了通推一体的设计:把通用计算和 AI 推理加速结合起来。当大模型从 “回答问题” 转向 “替人做事”,需要调用 API、查询数据库、调度工具时,GPU 并不擅长这些编排任务,而传统 CPU 又会成为瓶颈。

玄铁 C950 内置的自研矩阵加速引擎,不仅能独立运行小模型,还能和 GPU 协同减少数据拷贝,提升整体效率。实测数据显示,它搭载该引擎后,跑通千问三最强开源模型和 DeepSeek V3 满血版时,输出速度分别达到 34token 每秒和 18token 每秒,首 token 延迟低至 1.7 秒。

破解碎片化:让 RISC-V 从 “能用” 到 “好用”

有人质疑,RISC-V 开源自由的特性,会不会导致芯片碎片化,让软件生态无法兼容?孟建毅博士坦言,碎片化确实是 RISC-V 面临的挑战,但并非无法解决。

达摩院推出的 Flex 软件平台,就是破解这个难题的关键:它提供完整的处理器建模、开发环境和工具链,让华为、中国电信等厂商无需从零开始造轮子,只需在玄铁的基础上做定制化开发,就能快速适配自己的业务场景。

不同于传统 IP 的 “预制菜模式”,Flex 开放了存储、外围等底层设计,让应用厂商可以直接根据需求修改,真正实现 “应用定义架构”。

为了打通芯片设计、制造、软件适配的全链路,达摩院还联合产业链伙伴成立了 “无间联盟”。孟建毅说,生态的难点早已不是基础软件,而是让下游应用感知到 RISC-V 的价值:他们正在推动支持 WPS、钉钉等常用软件,甚至让 RISC-V 笔记本落地,让更多厂商看到这个架构的实用价值。

从 2019 年第一款玄铁 C910 发布时的无人问津,到如今 C950 成为 “地表最强”,达摩院用七年时间打磨了 14 款处理器,累计出货超过 45 亿颗。很多人好奇,达摩院为何要投入七年时间做这件事?

有人说,这是为了做一款更强的 CPU,或是一条完整的产品线。但孟建毅博士的答案更深远:他们想要让中国芯片第一次有机会,不只是使用别人定义的架构规则,而是参与定义规则。

这才是架构主权的真正含义:它不是封闭的口号,而是当你需要时,既有平起平坐的性能,也有修改底层的自由,还有繁荣的生态承接你的想象。

RISC-V 不是 x86 或 ARM 的备胎,它是为满足全新需求而生的架构。x86 和 ARM 各自有时代背景,但 AI 时代的智能体场景、定制化算力需求,都在倒逼架构革新。

如今的 RISC-V,已经不再是只能打打杂的低端架构,而是能和 x86、ARM 长期共存,甚至在新赛道开辟新可能的开源解决方案。

打开网易新闻 查看精彩图片

回顾这七年,达摩院没有走补位的老路,而是选择了一条更难的路:用一款又一款标杆产品,硬打出自研架构的底气。

对于中国芯片产业来说,RISC-V 带来的不是一条捷径,而是一次换道超车的机会 —— 我们终于可以站在底层架构的层面,和全球玩家一起定义未来的芯片规则。当然,这条路依然充满挑战,但从 C910 到 C950,我们至少已经看到,有人真的在为之努力。