金融界2025年7月4日消息,国家知识产权局信息显示,微软技术许可有限责任公司申请一项名为“用于在语言翻译通信会话期间利用发言者的自然语音安全地合成话音的技术”的专利,公开号CN120266201A,申请日期为2023年10月。

专利摘要显示,在本文中描述了一种用于在语言翻译语音呼叫期间安全地合成发言者的语音的技术。当在发言者与一个或多个其他呼叫参与者之间首次发起语音呼叫时,在服务器计算机处接收表示发言者的话音的音频数据,其中,通过获得固定持续时间(例如,8秒)的样本来处理所述音频数据。然后,处理该固定持续时间的样本以生成发言者的语音简档,以用于以第二语言、以发言者的语音来生成合成话音。对音频数据进行采样并且生成语音简档的该过程以固定间隔(例如,每30秒)重复,使得在所述语音呼叫期间连续地更新所述发言者的所述语音简档。

本文源自:金融界

作者:情报员