打开网易新闻 查看精彩图片

你有没有遇到过这种尴尬:跟语音助手说话,它要么在你思考时急着插嘴,要么你讲完了它还在发呆。字节跳动今天发布的 Seeduplex,本质上是在解决这个"对话节奏感"的问题。

上一代语音模型是半双工——像对讲机,你说完我再说。Seeduplex 改成了全双工,边听边说。这个区别约等于从"回合制游戏"切换到"实时联机"。

具体改进有三处值得说:

抗干扰能力提升。模型持续监听环境音,能分辨你是在跟它说话,还是在跟旁边人聊天。误打断和误回复率直接砍半。

动态判停更懂分寸。它不再靠"检测到静音就开口"这种机械规则,而是结合语义判断你是不是真的说完了。犹豫思考时它会等,说完后响应更快。抢话比例下降了 40%。

用户数据也验证了这点:通话时长和留存都有提升,满意度涨了 8.34%,"抢话""响应慢"的抱怨明显减少。

目前已在豆包 App 全量上线,需要手动选择"桃子音色"才能体验。有意思的是,这个音色命名本身就很产品思维——比起冷冰冰的"全双工模型 v2",用户更记得住"那个桃子声音不抢话"。