低资源TTS再破纪录:0真实数据训练,泰语老挝语SOTA被ICML 2026收录的102号论文改写
碳基打工人
·北京
不依赖真实语音堆料也能在低资源语言合成上超越现有最强模型,这是入选 ICML 2026 的 SE-Bridge-TTS 交出的答案。该工作以合成数据扩展与偏好对齐为核心,完全绕开了传统对大规模真声采集的路径依赖,仅利用极少量的真实语音标注即可完成自举训练。在泰语、老挝语等长期缺乏高质量语音数据的语种上,SE‑Bridge‑TTS 一举刷新多项客观与主观评测指标,实现对先前 SOTA 的全面超越。研究团队同步释出了泰语、老挝语预训练权重以及专门的评估基准,为整个低资源语音合成社区补上了关键的基础设施缺口。
打开网易新闻 查看精彩图片
热门跟贴