观点网讯:5月22日,智谱宣布,面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”,其模型输出速度达到400 tokens/s,刷新当前全球大模型厂商API的速度上限。
据悉,该模型首次在国产大模型中实现旗舰级能力与极致低延迟的结合,用户无需再为响应速度牺牲模型质量。实测在AI编程场景中,写代码速度提升近10倍,模型能持续理解工程上下文并生成代码与修改方案。
在3D游戏场景中,玩家输入文字后模型可实时调整场景,此前因延迟无法落地的产品形态开始具备可行性。在交互界面,模型能即时生成匹配用户需求的工具与交互,甚至做出意图判断。
目前GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景,现已面向智谱MaaS平台部分企业客户开放。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
热门跟贴