0
训练了几个克隆声音的模型,可以根据参考音频生成ChatTTS使用的音色嵌入。
模型Demo页面: http://region-9.autodl.pro:41137
欢迎大家反馈一下测试效果,加入QQ群474529811给建议或者讨论。
用法:下载声音模型(.pt结尾),记住temperature要设置得非常低,否则声音会不准确。 ` rand_spk = torch.load(f'my_speaker.pt')
params_infer_code = { 'spk_emb': rand_spk, # add sampled speaker 'temperature': .000001, # using custom temperature }
texts = ['hello world', '你好呀,旅行者!']
wavs = chat.infer(texts, params_infer_code=params_infer_code) `