Fish Speech：低显存用户的新宠，性能媲美GPT-SoVITS的开源文本转语音模型

AIGC视界汇

2024-07-05 21:26 ·北京

近期，开源社区迎来了一款名为Fish Speech的文本转语音（Text-to-Speech，TTS）模型，这款模型以其卓越的性能和低资源消耗特性，引起了广泛关注。Fish Speech在保持高质量语音合成的同时，对GPU显存的需求远低于同类模型，如GPT-SoVITS，这使得它在资源受限的设备上也能运行自如。

Fish Speech的特点

低显存占用：Fish Speech的优化设计使其能在低至4GB的GPU显存下运行，这对于个人开发者和小团队来说是一个巨大的利好，意味着无需昂贵的高性能GPU即可进行高质量的语音合成。

高质量语音合成：尽管对硬件要求较低，但Fish Speech在语音质量上并不妥协，能生成自然流畅、情感丰富的语音，与GPT-SoVITS等顶级模型相当。

开源与可定制：Fish Speech是一款完全开源的模型，这意味着开发者不仅可以免费使用，还可以根据自身需求对其进行修改和扩展，增加了模型的灵活性和适用性。

快速部署：得益于其轻量化的设计，Fish Speech能够快速部署在各种平台上，无论是桌面电脑还是嵌入式设备，都能实现即时的语音合成服务。

官网地址：https://top.aibase.com/tool/fish-audiowenbenzhuanyuyin

项目地址：https://github.com/fishaudio/fish-speech

版权声明：图片和内容来源互联网

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴