现在大家不管怎么优化提纯原始的人物语音,就算训练出来后loss<2.0,生成的语音也带有电流音。 会不会还是训练器本身的问题:
首先就是,当你用MockingBird GUI打开本地音频,它播放时就有几率是带有电流音;
另一个就是,在你生成的saved_models的wavs文件夹里,存放的都是训练时生成的音频,他们全都带有严重电流音,而且声音质量并没有随着step的增加而有任何改善。
希望大神能够指导一下我等小白,怎么能生成无电流音的声音
现在大家不管怎么优化提纯原始的人物语音,就算训练出来后loss<2.0,生成的语音也带有电流音。 会不会还是训练器本身的问题:
首先就是,当你用MockingBird GUI打开本地音频,它播放时就有几率是带有电流音;
另一个就是,在你生成的saved_models的wavs文件夹里,存放的都是训练时生成的音频,他们全都带有严重电流音,而且声音质量并没有随着step的增加而有任何改善。
希望大神能够指导一下我等小白,怎么能生成无电流音的声音
同问,不知道怎么生成无电流音的
你用的vocoder是哪个?如果频谱ok的话,大概率是vocoder问题
为什么考虑是vocoder问题呢?
vocoder没训练好的话,电音就会很突出
啊,我一直就是用python pre.py D:\MockingBird-main -d aidatatang_200zh -n 7 python synthesizer_train.py test D:\MockingBird-main\SV2TTS\synthesizer 这俩命令呀,没有我自己搞的vocoder
不要用hifigan这个vocoder,电音很严重
我一直用的是pretrained呀,训练前准备的语音数据绝对时纯净的语音,但训练出来,就会有电音
我一直用的是pretrained呀,训练前准备的语音数据绝对时纯净的语音,但训练出来,就会有电音
pretrained的效果本来就一般般。。要再训练
在训了,在训了,但是又发现俩问题:
① 想训练wavernn声码器,执行python vocoder_train.py