[2noise/ChatTTS]根据参考音频克隆音色的模型，欢迎试用 Voice Clone

训练了几个克隆声音的模型，可以根据参考音频生成ChatTTS使用的音色嵌入。

欢迎大家反馈一下测试效果，加入QQ群474529811给建议或者讨论。

用法：下载声音模型（.pt结尾），记住temperature要设置得非常低，否则声音会不准确。 ` rand_spk = torch.load(f'my_speaker.pt')

params_infer_code = { 'spk_emb': rand_spk, # add sampled speaker 'temperature': .000001, # using custom temperature }

texts = ['hello world', '你好呀，旅行者！']

wavs = chat.infer(texts, params_infer_code=params_infer_code) `

hoveychen

效果不错👍

6drf21e

QQ群搜不到啊

redstoneleo

用自己的声音简短录了两句话测试，用噪声比较少的声音做克隆时能拷贝一个接近的音色出来，多句话之间的音色一致性也比较高，不过生成声音似乎有比较多噪声，音色也不是完全一样

ZaymeShaw

请问一下克隆模型可以在哪里下载？

wangqun888

测试了下，效果不错~ 求一个本地部署和使用的方式。

hello2mao

想請問使用方式還有程式的部分想了解提取.pt是如何執行的，謝謝!

yiwei0730

感谢，用自己的声音测试了，没想到用纯中文训练的spk用在中英混杂场景异常好用，比用中英混杂的录音训练出来的spk还好用。还希望未来能开源，感激不尽。

atfa

回答