来源:中国电子报
随着智能体(Agent)深度融入业务一线,RISC-V正在以前所未有的速度向数据中心渗透。今年以来,国内RISC-V领军企业在服务器级别CPU内核、面向云端Agent的处理器核、数据中心管理控制单元、千卡集群等领域持续取得突破,为Agent时代的AI数据中心提供更加灵活、高效的计算范式。国际方面,英伟达投资SiFive,并将NVLink引入RISC-V系统,以打破传统CPU对AI性能扩展的限制。智能体时代,RISC-V在数据中心场景有哪些切入机遇和发挥空间,又面临哪些新的要求和挑战?
智能体重焕CPU价值
RISC-V迎来数据中心增量空间
随着AI的竞争焦点从大模型走向智能体,数据中心的算力结构正在发生变化。
在大模型时代,GPU是数据中心的算力核心。Futurum Intelligence研报显示,2022年,CPU与XPU尚且占据数据中心半导体的绝大部分市场份额。随着ChatGPT等通用大模型引爆算力需求,GPU的市场份额大幅提升,2023年已经与CPU+XPU持平,2025年占比提升至约75%,成为数据中心算力的绝对主导。
然而,在智能体时代,CPU声量渐涨,大有“重回牌桌”的趋势。
“生成式AI时代,无论是通用大模型还是结合领域知识的垂类大模型,都是‘问答式’AI,接收用户给出的提示词,经过推理计算输出Token。而智能体的本质是将推理与业务紧密结合到一起,让AI能干活,是‘执行式’AI,这会推动数据中心的计算范式从‘以GPU为中心的计算密集型’,向‘以CPU为中心的控制密集型和I/O密集型’转移。”上海灵睿智芯联合创始人、副总裁李华庆向《中国电子报》表示。
具体来看,在智能体拆解、执行任务的流程中,最耗费时间的部分是外部工具调用、业务逻辑执行以及各类模块、控制流之间的数据交互,而此类工作流由CPU承载。
“智能体让CPU重新成为数据中心的价值核心,但其角色不再是计算中心,而是系统总调度员。”赛昉科技创始人兼CEO徐滔向《中国电子报》指出,“智能体需要完成任务拆解、工具调用、数据库查询、权限校验、结果验证等一系列复杂的系统级操作,这些恰恰是CPU的强项。”
CPU的定位变化及配比上升趋势,使数据中心的算力模型不再拘泥于“唯GPU论”的单一逻辑,也为RISC-V带来了增量空间。
从产品布局来看,RISC-V在CPU领域已成为X86、Arm以外的“第三极”,获得了较高的行业认可度。2026年以来,国产RISC-V CPU产业链在数据中心取得一系列突破。阿里巴巴达摩院的旗舰CPU玄铁C950在Specint2006基准测试中突破70分,刷新全球RISC-V性能纪录;中国科学院计算技术研究所与北京开源芯片研究院联合打造“香山”开源高性能RISC-V通用计算系统解决方案,其“昆明湖”处理器核的SPEC CPU2006实测分值达16.5分/GHz,搭配全球首个数据中心开源片上互连网络“温榆河”,为先进计算生态提供开源共性底座;灵睿智芯推出全球首款动态4线程服务器级RISC-V CPU内核P100,SPEC CPU2006单核性能超过20/GHz;进迭时空第三代高性能RISC-V处理器核X200完成研发,面向云端Agent与旗舰级终端Agent应用进行针对性优化。
C950(来源:XuanTie玄铁)
从设计理念来看,RISC-V的模块化设计、可扩展性强、可编程性强等天然优势,为AI芯片带来了更加高效灵活的设计理念,也更加贴合智能体催生的长尾业务需求。
“随着智能体的形态和平台越来越多,单一芯片架构难以高效支撑各种智能体和AI催生的复杂长尾业务,需要结合具体的工作负载和业务特性进行优化。这对于传统指令集来说是难以实现的,因为它们的指令集是一个完整的体系,不能选择性地采用指令。而RISC-V采用模块化的设计理念,既能够按需选择指令,也可以添加自定义指令,实现‘工作负载定义芯片’,大幅提升计算效率和能效,这对于智能体极具吸引力。”李华庆表示。
从系统构建来看,RISC-V能为数据中心带来一系列系统级优势。徐滔指出,RISC-V在数据中心的优势,不能只看技术指标,更要从系统角度去理解。以数据中心的管理平面(管控单元)为例,需要的不是一颗性能极强的大核,而是一颗“足够强”的核,再加上完整的软件栈、安全机制和系统解决方案。RISC-V能够在这一层面快速满足不断变化的需求,例如安全需求、调度需求、固件与软件的迭代需求等。
“RISC-V在数据中心的核心优势可以概括为开放性带来的系统级可控性与可定制性。相比传统指令集架构,RISC-V更容易按照客户意愿进行定制,且能够真正落地。这种‘可控性’的本质,是准确把握并快速实现客户需求的能力。”徐滔说道。
“能用上”不代表“被看到”
入局切口要兼顾价值与落地
如果单单从“用上了”的角度来看,RISC-V在数据中心领域已经有了相当的出货量,仅英伟达每年在AI芯片中使用的RISC-V核就在10亿颗以上。
但这种相对“隐形”的应用,不能与RISC-V规模化应用于数据中心划等号。李华庆向记者指出,RISC-V内核在英伟达AI芯片的应用,更像是“航母上的螺丝”,也就是以低端产品的形态进入了高价值领域。
那么,如果以“显性”“关键”“更具核心价值”等标准来看,当前RISC-V在高性能数据中心有哪些可落地的切入点?
在芯片层面,受访企业结合自身的观察与实践,重点关注两类产品。
一是面向AI等新型工作负载的芯片。希姆计算副总裁王得科向记者表示,RISC-V作为新兴的指令集架构,不需要像传统的X86或ARM架构一样向下兼容老版本指令。同时,RISC-V作为开源指令集架构,可以根据AI的演进,及时制定出满足需求的向量扩展指令和矩阵扩展指令,并在性能,功耗和面积(PPA)等方面进行极致的优化。此外,依托RISC-V开源生态的AI芯片,能够在后续的迭代优化中形成良好的正反馈。记者了解到,今年3月,中国移动西藏公司千卡RISC-V算力集群在拉萨顺利完成交付并正式投入运营,该千卡集群依托希姆计算自研STCP950L NPU AI算力卡搭建而成,在试运行期间无故障支撑从70亿到6710亿模型的部署。
RISC-V AI算力卡的千卡集群(来源:希姆计算)
二是与数据中心“管理平面”相关的芯片。徐滔认为,RISC-V切入高性能数据中心的最佳路径是“管理平面”,比如BMC(基板管理控制器)、DPU(数据处理器)和内存管理器。以BMC来说,随着数据中心规模不断扩大、功能模块日益复杂,各组件之间的协同亟需一个独立、标准化、可控的数据中心管控单元,RISC-V架构的BMC正好能满足这一需求。
“管理平面生态虽然复杂,但相对可控,适合RISC-V现阶段的能力成熟度。从管理平面切入,是RISC-V在数据中心落地的务实路径。”徐滔说道。据悉,2025年11月,赛昉科技发布首款基于RISC-V架构的数据中心管理芯片 “狮子山芯”,实现了RISC-V在数据中心领域的首次规模化商业落地。
在业务和应用层面,李华庆认为,相较于开放的通用计算平台,数据中心的存储集群、数据库集群等垂类业务,会是RISC-V更易落地的切入点。
“RISC-V的生态可以从基础生态和商业生态这两个层面来看。目前RISC-V已经有了不错的基础生态,能够支持越来越多的操作系统、编译器、系统基础库等;但在商业生态上,由于RISC-V此前缺乏高性能的硬件平台,而商业软件基本都运行在高性能CPU上,导致RISC-V的商业生态较为薄弱。”李华庆说,“垂类业务的软件数量有限且可控,通过标准接口提供服务,能够克服RISC-V在商业生态的不足。”
以数据中心的存储服务器集群为例,服务器运行的软件类型相对固定(文件存储、块存储、对象存储等),数量相对可控,完成这些软件的配置和优化之后,就可以通过标准接口对外提供服务。在业务形态上,业务逻辑和数据存储处于松耦合或者解耦状态。相比开放平台,这种接口之内自成体系,接口之外与上层业务解耦的应用形态,能够更好地帮助RISC-V应对生态挑战,真正在数据中心扎根落地。
RISC-V CPU面临五类新要求
底层能力、生态、产业协同均待完善
虽然智能体为RISC-V开辟了更多入局机会和增量空间,但也对CPU和AI芯片设计提出了一系列新要求,这也是RISC-V IP、芯片、系统设计企业必须思考的课题。
以RISC-V CPU为例,智能体主要对CPU设计提出五类要求。
一是并发能力。李华庆表示,未来企业级任务的完成,往往需要多个智能体的联合协同,涉及数据预处理和后处理、推理计算、工具调用、数据交互等多种类型任务的大量并发,这就对CPU的并发能力提出了更高要求。灵睿智芯P100的动态4线程技术正是为应对这一需求而设计。
二是内存容量大幅提升。徐滔指出,CPU需要远超GPU HBM容量的主内存,以支撑复杂任务的状态,保持对上下文的管理。
三是低延迟与高带宽。作为直接面向终端用户的系统总调度员,CPU的响应速度必须快于人类感知阈值,不能有明显的等待。
四是CPU和AI芯片的协同设计会更普遍。王得科提到,未来AI原生设计的数据中心计算系统会走向CPU与AI芯片相互均衡的架构,以支持智能体业务需要的持续性高负载、海量存储、数据搬运,以及低时延高并发的网络需求。
五是安全与授权机制。徐滔表示,智能体的自主行为带来了新的安全挑战。例如,智能体可能误读邮件内容并替用户执行购买操作。这不是传统的防攻击问题,而是用户与智能体之间的“安全契约”问题,需要芯片级和系统级的权限控制与行为审计机制。
此外,RISC-V要真正在数据中心落地,就不能只关注性能跑分,而要思考如何让RISC-V用起来、用得好。徐滔指出,RISC-V必须优先补齐底层核心能力。
一是服务器平台标准化。RISC‑V International正在推进RVA23等服务器平台规范,这是整个产业链协同的基础。
二是虚拟化能力。虚拟化是数据中心核心刚需,相关规范仍需完成实景验证与性能打磨。
三是内存系统。RISC-V需要完善对高性能、大容量、高可靠内存系统的支持,以支撑大算力、大内存业务负载。
四是RAS机制。可靠性、可用性、可服务性是服务器商用准入底线,也是客户采购的核心前提,目前RISC-V相关服务器级RAS机制仍需完善。
五是固件安全。固件安全是服务器稳定可信运行的核心保障,当前RISC-V固件安全架构、安全启动等配套体系尚不成熟。
同样值得注意的是,面向智能体的最新需求,RISC-V要与时俱进地进行标准研制和生态适配。王得科表示,AI方面,需尽快推动矩阵指令集的标准化;外设方面,需要适配最新的DDR、PCIe及CXL标准;生态方面,进一步推动RVA23规范的实施,确保软件生态的兼容性。
在产业协作层面,需要建立灰度导入机制,增强产业链上下游的互信合作。李华庆提到,RISC-V面向数据中心的高性能产品有着较高的研发和流片成本,如果仅提供给开发者社区,就难以兑现商业价值。但对于下游客户来说,高性能产品会用来承载重要业务,试错成本太大。“这就需要产业链上下游共同探索一套灰度导入机制,比如先从一些相对可以和业务解耦、影响范围小的应用切入,逐步增强用户信心。”李华庆说道。
关注中国电子报
关注本文作者
热门跟贴