打开网易新闻 查看精彩图片

8月29日消息(记者 向密) 搜狗宣布将其核心技术能力“搜狗听写”服务开放,并与爱国者、Newmine纽曼、索尼录音笔、万城集团四家录音笔企业成立AI创新联盟。此外,搜狗还推出升级版AI录音笔炫彩版新品。

搜狗CEO王小川透露,目前搜狗输入法语音请求峰值已超过7亿次,语音识别准确率达到98%。搜狗的语音增强、语音变声、语音合成等能力已经在多场景落地应用。

根据介绍,此次对外开放的搜狗听写服务,实时语音转写运用了搜狗自研的延迟可控的Adaptie Attention-based端到端建模技术,非实时语音转写功能使用深层Transformer-based端到端语音识别技术,语音转写准确率可达95%以上。

在语音增强方面,搜狗自研的Smart oice麦克风阵列算法能够对噪声和混响进行多重深度优化,确保人声的高保真还原。

在智能辅助编辑方面,搜狗语音转写可以通过云端智能纠错编辑技术,基于词图和输入纠错模型,针对置信度低的转写结果提供多个候选词,帮助用户对转写结果进行纠正,同时还具备自动区分说话人、智能文本顺滑和标点预测等能力,可以为用户提供便捷功能。

另据,本次搜狗听写服务实现了与搜狗输入法的打通。官方表示,搜狗输入法目前在PC端占有99%的市场份额,在手机端用户日活超4.5亿,搜狗听写服务基于搜狗输入法的用户使用习惯,能够自动构建个性化识别网络,使用户常用语错误率下降40%。搜狗开放听写服务后,可以为市场上90%以上的录音笔产品提供接入服务,让所有有需求的用户享受“录音1小时,出稿5分钟”的体验。(完)