[babysor/MockingBird]使用中文readme中的第三个模型，同样的input音频文件和文字内容，得到的结果音频有杂音且每次效果不同

2024-07-15 229 views 7 likes

使用中文readme中的第三个模型，同样的input音频文件和文字内容，得到的结果音频有电流音且每次效果不同。

这是哪里的设置会影响到结果生成吗？求告知！输入输出音频.zip

Jinkeee

回答

同问，谢谢

xeoshow

看截图，大概率是你的vocoder模型不够好，用一下hifigan

babysor

看截图，大概率是你的vocoder模型不够好，用一下hifigan 在GUI工具里面，Vocoder选择g_hifigan有电音，反而wavernn_pretrained效果比g_hifigan要好点，这是啥原因呢

cos43

你们知道如何训练vocoder吗，现在我不能保存训练的vocoder模型，只有log文件，怎么办

HaSaKiYasuooo