[2noise/ChatTTS]保存并基本固定音色的方法

2024-06-05 757 views
6

采用core里的sample_random_speaker方法随机生成音色:

text = "简短的测试文字,可以节省生成测试语音的时间"

rand_spk = chat.sample_random_speaker()
params_infer_code = {
    'prompt':'[speed_5]',
    'temperature':.3,
    'spk_emb': rand_spk,
}

wavs = chat.infer(text, use_decoder=True, params_infer_code=params_infer_code)

觉得音色不错的话,可以采用如下方式保存:

torch.save(rand_spk, 'speaker/girl4.pth')

下次再使用这个音色的话可以采用torch.load进行加载:

rand_spk = torch.load('speaker/girl4.pth')

回答

1

应该还要把temp 设的很小才行,例如.000003这样

4

音色这个如果有个试听列表就好了 哈哈

7

这个现在最大的问题就是无法固定音色,尤其是在web页面上。同样的参数,换了文本内容,音色就变了;同样的参数同样的文本开头,后面多加了几个字,音色也变了。这样的话,所谓的SEED NUMBER不就没什么意义了?