品玩1月15日讯,据 Cerebras 官方消息,OpenAI与Cerebras近日签署多年协议,计划自2026年起分阶段部署750兆瓦的Cerebras晶圆级系统,用于服务OpenAI客户。该部署将成为全球规模最大的高速AI推理基础设施。
双方自2017年起持续交流,此次合作标志着大模型与专用硬件架构的深度融合。Cerebras系统在运行大语言模型时,响应速度较GPU方案最高提升15倍,显著降低延迟。
OpenAI的Sachin Katti表示,Cerebras为其平台提供了专用低延迟推理能力,将支撑更自然、实时的AI交互体验。Cerebras称,其晶圆级技术将通过此次合作触达数亿乃至数十亿用户。
打开网易新闻 查看精彩图片
热门跟贴