[babysor/MockingBird]使用中文readme中的第三个模型,同样的input音频文件和文字内容,得到的结果音频有杂音且每次效果不同

2024-07-15 777 views
1

使用中文readme中的第三个模型,同样的input音频文件和文字内容,得到的结果音频有电流音且每次效果不同。 image image

这是哪里的设置会影响到结果生成吗?求告知! 输入输出音频.zip

回答

5

同问,谢谢

0

看截图,大概率是你的vocoder模型不够好,用一下hifigan

6

看截图,大概率是你的vocoder模型不够好,用一下hifigan 在GUI工具里面,Vocoder选择g_hifigan有电音,反而wavernn_pretrained效果比g_hifigan要好点,这是啥原因呢

3

你们知道如何训练vocoder吗,现在我不能保存训练的vocoder模型,只有log文件,怎么办