在人工智能模型参数规模向万亿级迈进、对算力需求持续爆炸的当下,大规模GPU集群的协同效率,尤其是芯片间通信延迟,已成为制约整体算力的核心瓶颈。2026年1月,摩尔线程智能科技一项名为“第一图形处理器、远程通信方法、芯片、服务器及设备”的发明专利获得授权,直指这一行业痛点。该技术通过在硬件层面实现计算与通信的并发执行,有望将多卡协同中的数据等待时间大幅压缩,为国产高性能计算与智算集群的发展注入新动能。

打开网易新闻 查看精彩图片

传统GPU架构在面临远程通信任务时,数据需经由计算核心内的存储资源进行中转。这一过程不仅占用本应用于计算的宝贵硬件资源,更会导致计算任务被强制中断,产生显著的“计算空泡”,使得集群的等效算力利用率难以提升。摩尔线程此次获得专利的技术,其革新之处在于在数据加载引擎中开辟了独立的专用远程通信通路

凭借这一设计,当需要进行跨处理器数据交换时,通信指令可直接通过该通路访问全局存储单元并送达目标GPU,完全绕过了计算核心。这带来了双重收益:计算单元得以持续专注运算而不被干扰,实现了真正的“计算-通信”并发;同时,精简的数据路径也直接降低了传输延迟与系统功耗。根据公开信息,在与合作伙伴的适配测试中,该技术已帮助实现通信延迟降低约60%的显著效果。

这项突破并非孤立事件,而是摩尔线程系统性技术布局下的重要成果。其早在“花港”架构设计阶段就已预埋异步通信引擎,并集成自研的MTLink高速互联技术。配合此次的底层硬件通路创新,公司正构建从芯片级到集群级的完整通信优化体系。据悉,基于MTLink2.0技术,其单机8卡互联的带宽利用率已可接近85%,并能智能感知拓扑结构,为跨节点通信匹配最佳路径。

打开网易新闻 查看精彩图片

当前,中国正加速建设自主可控的算力基础设施。在此背景下,摩尔线程此项能够直接提升大规模集群实际效能的专利技术,其战略价值尤为突出。它解决的不仅是单卡或单机性能问题,更是面向万卡乃至更大规模智算中心的核心可扩展性问题。随着AI与科学计算对算力需求的复杂度不断提升,此类底层通信技术的突破,将成为衡量国产算力平台竞争力的关键指标之一。

从“花港”架构发布到持续获得核心专利授权,摩尔线程正沿着清晰的路径夯实其技术护城河。在国产GPU向高端领域攀登的征程中,单纯追求峰值算力已远远不够,系统级效率与可扩展性正成为新的竞争焦点。此项通信专利的落地,标志着国产GPU在攻克集群效能瓶颈上迈出了坚实一步,为未来更大规模的自主算力部署提供了关键的技术支撑。