智通财经APP获悉,伴随智能体时代浪潮奔涌,云知声(09678)正加速完成其“一基两翼”技术战略的能力拼图。继年前升级“山海·知医”5.0医疗大模型后,公司于近日重磅发布“山海·知音”大模型2.0。

据悉,“山海·知音”大模型2.0依托“山海·Atlas”的多模态、跨语言基座能力,核心聚焦三大能力进化——听懂专业与乡音、聊出亲情与温度、极致机敏反应。

在“听懂”的维度,此次模型ASR能力在公开测试集和自有全场景测试集中,均显现了领先的语音识别能力,评测中实现了从通用到极端全面的领先水平,超过了国内主流的开源和闭源语音大模型,达到业界最高水平。

在“表达”层面,山海·知音-TTS以“高度拟人+创意多元”为核心,目前支持12种方言(粤语、四川话、上海话全拿下)+ 10种外语,甚至能切换12种普通话风格。

更重要的是,山海·知音2.0基于端到端交互大脑,攻克了流畅全双工交互的挑战,支持随时打断、即时接话与连贯追问,使人机对话如挚友交谈般行云流水。

这一切能力的背后,是云知声独创的 “山海·Atlas”智算一体基座,将通用多模态大模型底座与Atlas基础架构深度整合,既是专业智能体的基础,也是感知AI中枢的根基。