英国初创公司Olix Computing Ltd.开发集成光学组件的人工智能芯片,近日宣布获得2.2亿美元融资。
据《金融时报》报道,本轮投资由比利时风险投资公司Hummingbird Ventures领投,使这家英国公司的估值超过10亿美元。此前,Olix还曾获得Plural、Vertex Ventures、LocalGlobe和Entrepreneurs First的投资。
Olix的芯片专为推理任务优化,即在训练完成后在生产环境中运行AI模型。虽然芯片具体包含哪些光学组件以及如何使用尚不明确,但公司网站的博客文章显示,其芯片具有"新颖的存储和互连架构"。这表明Olix正在使用光子组件来驱动互连,即处理器中负责在电路间传输数据的部分。
多家初创公司正在开发光子互连技术。其中资金最充足的公司之一Ayar Labs Inc.已构建出可用于制造表面积达40平方厘米芯片的光学中介层,这是英伟达Blackwell B200显卡尺寸的两倍多。
光学互连的价值在于光的传输速度比当今芯片使用的电信号更快,理论上可以提供显著更高的吞吐量,同时功耗更低。
Olix表示,其处理器旨在解决"内存墙"这一技术挑战。这涉及AI芯片用于存储数据的外部存储器HBM。
显卡通过将数据从HBM内存加载到板载缓存,然后将结果保存回HBM模块来执行计算。芯片在内存间传输数据的速度直接影响性能。当芯片因HBM模块的性能瓶颈而无法全速运行时,就会出现内存墙问题。
据Olix介绍,其芯片设计通过不使用HBM来解决这一挑战。该处理器仅使用SRAM存储数据,这是一种速度显著更快的内存类型。
HBM内存单元由一个晶体管和一个微型电池(电容器)组成,而SRAM使用六个晶体管的更复杂设计。SRAM性能优势的另一个因素是它通常直接集成到AI芯片中,而HBM内存作为独立模块实现,这意味着SRAM更接近主芯片的晶体管,从而减少数据传输时间。
初创公司Cerebras Systems Inc.在设计其晶圆级AI加速器时也优先考虑了SRAM。该芯片包含44GB的SRAM,使许多AI模型无需使用HBM即可运行。Olix声称其光子技术在交互性和延迟方面优于"纯硅SRAM架构"。
Olix的芯片被称为OLIX光学张量处理单元,简称OTPU。张量是AI模型用来保存信息的数学对象,许多AI芯片都包含专门优化来处理此类对象的电路。
该芯片可能还包含针对张量以外工作负载优化的电路。谷歌的张量处理单元同样设计用于为AI模型提供动力,将张量优化核心与标量和矢量单元相结合,这些电路针对内存管理等任务进行了优化。
Olix将使用新筹集的资金来支持芯片开发计划。公司网站的招聘信息显示,他们还在开发一个编译器,可以调整现有AI模型以在其芯片上运行。据《金融时报》报道,Olix预计明年开始向客户发货OTPU芯片。
Q&A
Q1:Olix的光子AI芯片有什么特别之处?
A:Olix的芯片集成了光学组件,采用新颖的存储和互连架构。它专为AI推理任务优化,使用光子技术驱动互连部分,光速传输比传统电信号更快,可提供更高吞吐量且功耗更低。
Q2:什么是内存墙问题,Olix如何解决?
A:内存墙是指AI芯片因HBM外部存储器的性能瓶颈而无法全速运行的问题。Olix通过完全不使用HBM,而是仅采用速度更快的SRAM存储器来解决,SRAM直接集成在芯片内部,数据传输距离更短。
Q3:OTPU芯片什么时候能投入市场?
A:根据《金融时报》报道,Olix预计明年开始向客户发货OTPU芯片。公司目前正在开发相应的编译器,用于调整现有AI模型以在其芯片上运行。
热门跟贴