芯东西(公众号:aichip001)
作者 | ZeR0
编辑 | 漠影
芯东西1月29日报道,今日,阿里巴巴集团全资半导体芯片业务主体平头哥官网上线高端AI训推一体芯片真武810E
这就是此前被央视《新闻联播》曝光的阿里自研芯片PPU。据悉,“真武”PPU已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博400多家客户。(阿里自研AI芯片曝光!)
至此,由通义实验室、阿里云、平头哥组成的阿里巴巴AI黄金三角“通云哥”首次浮出水面。
平头哥成立于2018年11月,注册地址在上海,已推出AI推理芯片含光800训推一体AI加速芯片真武810EArm服务器CPU倚天710高性能SSD主控芯片镇岳510超高频RFID电子标签芯片羽阵611羽阵600等芯片,并不断丰富产品线。
真武810E采用自研并行计算架构ICN片间互联技术,单卡采用96GB HBM2e内存,支持7个独立ICN链路,片间互联带宽达到700GB/s,可灵活配置多卡组合,应用于AI训练、AI推理和自动驾驶,已在阿里云实现多个万卡集群部署
阿里巴巴已将“真武”PPU大规模用于千问大模型的训练和推理,并结合阿里云完整的AI软件栈进行深度优化,为客户提供一体化产品和服务。
据业内人士透露,对比关键参数,“真武”PPU的整体性能超过英伟达A800和主流国产GPU与英伟达H20相当
另据外媒最新报道,升级版“真武”PPU的性能强于英伟达A100
多位行业从业者称,“真武”PPU性能具有优异稳定、性价比突出等特点,在业内口碑良好。
阿里巴巴正在将“通云哥”打造成一台AI超级计算机,它同时拥有全栈自研芯片的平头哥、亚太第一的阿里云,以及在全球享有盛誉的开源模型“千问”,可在芯片架构、云平台架构和模型架构上协同创新,从而实现在阿里云上训练和调用大模型时达到最高效率。
平头哥官网列出了真武810E的六大优势:全自研、高性能、强互联、高易用、规模验证、芯云一体
ICN(Inter-Chip-Network)是平头哥自研的片间互联技术,具有高性能、高带宽、低延迟优势,适用于大模型训练和推理应用。
每颗真武810E芯片配备7个ICN片间互联端口,配合平头哥自研互联加速库,实现多卡协同工作,从而高效支持大模型训练及推理需求。
平头哥自主研发的AI产品软件栈,具备完备的软件生态及工具链,拥有独立知识产权,具备统一的编程接口,可端到端支持用户自主业务落地和扩展,向上支持开发者和业务快速展开,向下兼容底层硬件和优化性能,实现软硬件高效协同。
(1)高效性:通过软件栈提供的API,用户可以基于SDK直接开发真武应用程序,支持自研生态;
(2)高兼容性:沿用当今主流编程环境,开发者可调用软件栈中统一的API,支持主流AI生态,无需修改应用代码。
官网列出了真武910E的四大应用场景
(1)自动驾驶:经过验证兼容超过50个自动驾驶常见模型,在感知、预测和端到端等多种模型架构下,全面支持智驾模型训推,并已形成多个万卡级别集群的部署应用
(2)AI训练:原生支持多种框架,具有高速片间互联和优异的集群线性加速比,兼容主流AI生态,提供高性能、高易用的训练算力。
(3)AI推理:原生支持主流推理引擎,并提供平头哥自研专用推理框架和算子库,结合大容量内存,为大模型推理提供针对性优化。
(4)多模态模型:在文生视频、图文生视频、图文生文等场景的推理和训练实测中均表现出不俗的性能,为基于多模态模型的应用场景提供高性价比算力
阿里巴巴2009年创建阿里云,2018年成立平头哥芯片公司,2019年启动大模型研究,经过长达17年的战略投入和垂直整合,实现“通云哥”全栈AI的完整布局。
官网显示,平头哥致力于AI时代的芯片基础设施创新,打造数据中心算力、存力、网力芯片和IoT芯片, 通过端云一体全栈产品系列为数字化、智能化时代提供无处不在的普惠算力。
该公司重点布局高性能、高性价比的自研数据中心芯片,提升数据中心能力和效率,通过软硬一体解决方案,加速新一代数据中心的规模化部署,促进AI从数字世界向物理世界的渗透。
热门跟贴