5
我在A100上运行的chattts,生成长文本需要很长时间,后面尝试去做文本分割,一段段的生成,速度也还是不行,之前实现了基于paddlespeech的语音合成,流式的效果很好,但是音色比较拉跨,有没有合成效果不那么拉跨,而且速度还可以的tts推荐
我在A100上运行的chattts,生成长文本需要很长时间,后面尝试去做文本分割,一段段的生成,速度也还是不行,之前实现了基于paddlespeech的语音合成,流式的效果很好,但是音色比较拉跨,有没有合成效果不那么拉跨,而且速度还可以的tts推荐
bert bits 2 试过没?
实测4090显卡下15秒生成2分钟的音频(批处理后再合并,显存占用12G)
目前我用的vits2
实测4090显卡下15秒生成2分钟的音频(批处理后再合并,显存占用12G)
可以提供一下代码吗,我这边测试没有这么快的速度,还是很慢
ChatTTS的延时比较严重,单纯批处理速度还行。如果要低延时,估计得改代码做流式输出,对于自回归模型,大概是可能可以做到的