打开网易新闻 查看精彩图片

微软正式宣布推出全新Maia 200芯片,这款芯片被定义为专门用于扩展AI推理能力的硅基工作马。

Maia 200是微软继2023年发布Maia 100后的最新产品,在技术配置上进行了全面升级,旨在以更快速度和更高效率运行强大的AI模型。该芯片集成了超过1000亿个晶体管,在4位精度下可提供超过10 PetaFLOPS的算力,在8位性能下约为5 PetaFLOPS,相比前代产品实现了大幅提升。

推理是指运行模型的计算过程,区别于训练模型所需的计算。随着AI公司的成熟发展,推理成本已成为其整体运营成本中日益重要的组成部分,这促使业界重新关注优化推理过程的方法。

微软希望Maia 200能够成为这种优化的重要组成部分,帮助AI企业以更少的中断和更低的功耗运行业务。微软表示:"从实际角度来看,一个Maia 200节点可以轻松运行当今最大的模型,并为未来更大的模型留有充足空间。"

微软的新芯片也体现了科技巨头转向自主设计芯片的增长趋势,目的是减少对英伟达的依赖。英伟达的尖端GPU已成为AI公司成功的关键因素。例如,谷歌拥有TPU(张量处理单元),这些单元不是作为芯片销售,而是通过其云服务提供计算能力。亚马逊则推出了自己的AI加速芯片Amazon Trainium,并在12月份发布了最新版本Trainium3。在每种情况下,这些处理器都可以分担原本分配给英伟达GPU的部分计算任务,从而降低整体硬件成本。

通过Maia芯片,微软正将自己定位为与这些替代方案竞争的有力选手。在周一的新闻稿中,微软指出Maia在FP4性能方面是第三代Amazon Trainium芯片的3倍,FP8性能超过了谷歌第七代TPU。

微软表示,Maia已经在为公司超级智能团队的AI模型提供动力支持,同时也在支持聊天机器人Copilot的运营。截至周一,公司已邀请包括开发者、学术界和前沿AI实验室在内的各方使用其Maia 200软件开发套件进行工作负载处理。

Q&A

Q1:Maia 200芯片有什么特别之处?

A:Maia 200是微软专为AI推理设计的芯片,集成超过1000亿个晶体管,在4位精度下可提供超过10 PetaFLOPS算力,在8位性能下约为5 PetaFLOPS,相比前代产品有大幅提升。一个节点就能轻松运行当今最大的AI模型。

Q2:为什么科技公司要自主设计芯片?

A:主要是为了减少对英伟达GPU的依赖,降低整体硬件成本。谷歌有TPU,亚马逊有Trainium,现在微软推出Maia,都是为了在AI推理方面提供更经济高效的替代方案。

Q3:Maia 200目前在哪些方面得到应用?

A:Maia 200已经在为微软超级智能团队的AI模型提供算力支持,同时支持聊天机器人Copilot的运营。微软还向开发者、学术界和前沿AI实验室开放了Maia 200软件开发套件。