[2noise/ChatTTS]生成语音质量不错,但速度太慢 没法用

2024-06-12 159 views
0

OS: MX x86_64 Host: Z390 AORUS ELITE Kernel: 6.8.12-1-liquorix-amd64 CPU: Intel i7-9700K (8) @ 3.601GHz GPU: NVIDIA GeForce RTX 3090 Memory: 10768MiB / 64230MiB Cuda 11.8

生成12秒的语音 需要120秒以上, 是不是我哪里设置的不对? Screenshot_2024-06-05_19-46-38

回答

7

这个模型分两部分执行,上边的进度条执行文本识别,应该是添加情感标识和辅助语气词,下边的进度条是语音合成。 如果把top_p这几个参数调的太大,他就会在原句子中添加过多的新内容。 多分句,多段行,执行起来就快了。负面的就是句和句之间情感可能不一样。