根据中国政府采购网2月5日公布的信息显示,中国移动广东公司以约1.55亿元的报价,成功中标深圳光明大装置算力服务支撑平台采购项目。其中,包括一套基于昇腾芯片的华为温冷数据备份存储设备,设备单价为4459.86万元。
根据1月14日发布的招标公告文件显示,深圳光明大装置算力项目总预算1.555亿元,中移动中标价为1.5546亿元,与总预算相当。
据介绍,该招标项目主要构建光明大装置基础资源管理和服务底座,支撑光明大装置实现对外开放共享能力。项目软硬件配套同时需协同支持“光明大装置”项目达成整体系统性能指标,包括但不限于大模型万卡分布式训练算力利用率≥40%。千亿级自然语言大模型实际训练能效比≥210GFLOPS/W。千亿级自然语言大模型训练每天的 Token 吞吐量≥1000 亿 tokens/天。同时协同“光明大装置”项目中全局存储子系统达成存储聚合读带宽≥10TB/s,存储聚合写带宽≥10TB/s,存储系统并发 IOPS 能力≥10 亿 IOPS,单客户端的读带宽≥10GB/s,单客户端的写带宽≥7.5GB/s。
光明大装置的建设内容主要包括基础硬件和基础软件两个部分,打造大科学装置的基础底座。为了实现光明大装置对外开放共享能力,充分做好大设施应用的试验平台到应用赋能的衔接,拟在基础软件和基础硬件上新增建设“算力服务支撑平台”,构建大装置的基础资源管理和服务底座。
具体包括:
(1)智能算力开放服务系统软件及配套硬件。其中,智能算力开放服务系统软件需要能够纳管光明大装置所有 AI 服务器,实现 AI 硬件服务器的裸金属资源池化,同时对外支持以多租户的模式供用户按需申请裸金属资源池;同时还提供 NAT 网关、弹性负载均衡、域名解析、身份认证服务等功能;提供超大规模万卡集群的管理和调度,平台内置 AI 数据管理、开发管理、模型训练和部署管理模块,支持主流开源框架,降低开发者上手门槛和开发成本。
(2)信息安全与运维系统软件及配套硬件。其中,信息安全与运维系统软件能够为光明大装置提供立体化安全防护体系,构建以人工智能 AI 安全运营系统为安全运营体系中心的全网安全态势感知体系,实现“可信、可控、可管、可用”的安全防护体系,提供相应的运维支撑。
(3)温冷数据备份存储设备。主要是为光明大装置提供大规模、分布式、高性能的存储系统。
并且,在招标文件当中,招标方要求上述系统软件及硬件设备均“拒绝进口”,即要求采用国产化系统和设备。
此次公布的中标项目是“温冷数据备份存储设备”,单套设备采购价达4459.86万元,最终确定选用华为OceanStor Pacific 9550存储系统。
据介绍,该系统采用华为昇腾 910C 设备以及面向超密集群的天工架构进行建设,并使用性能最高的华为灵衢总线进行承载。整体系统提供智能算力规模为每秒一千六百亿亿次 16位浮点运算(16P FLOPS FP16)。
▲OceanStor Pacific 9550
其中,包括基础硬件、基础软件 2 个分系统。
(1)基础硬件分系统包含计算处理、互联通信和全局存储 3 个子系统。计算节点间采用灵衢总线进行互联。全局存储子系统配置高性能层存储设备 OceanStor A800(SSD 裸容量 30.9PB)和大容量层存储设备OceanStor Pacific 9550(HHD 裸容量 62PB),采用 RoCE 协议组网。
(2)基础软件分系统包括 AI 编程环境、程序性能分析与调优工具、高性能算子开发环境、分布式通信引擎、并行计算加速库 5 个子系统。
编辑:芯智讯-浪客剑
热门跟贴