日前,阶跃星辰正式发布新一代自动语音识别模型 StepAudio 2.5 ASR,主打速度与精度兼得,并率先将 LLM 推理加速技术引入语音识别领域。 推理速度提升 400%、时延降低 60%、推理成本直降 80%; 推理峰值达 500 tokens/s,约 5 分钟音视频可极速完成转写; 复用 LLM 原生 32K 上下文窗口,单次支持最长 30 分钟完整音频转写,告别传统「切片-转写-拼接」方案的上下文断裂问题; 在 5 个权威中文及英文开源测试集上,字错误率与词错误率均优于同类模型,长音频场景下精度无明显衰减。
日前,阶跃星辰正式发布新一代自动语音识别模型 StepAudio 2.5 ASR,主打速度与精度兼得,并率先将 LLM 推理加速技术引入语音识别领域。 推理速度提升 400%、时延降低 60%、推理成本直降 80%; 推理峰值达 500 tokens/s,约 5 分钟音视频可极速完成转写; 复用 LLM 原生 32K 上下文窗口,单次支持最长 30 分钟完整音频转写,告别传统「切片-转写-拼接」方案的上下文断裂问题; 在 5 个权威中文及英文开源测试集上,字错误率与词错误率均优于同类模型,长音频场景下精度无明显衰减。


JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图
JPG
长图