用的examples/ipynb/colab.ipynb的代码,zero shot这段如下
from ChatTTS.tools.audio import load_audio
spk_smp = chat.sample_audio_speaker(load_audio("30s.wav", 24000))
print(spk_smp) # save it in order to load the speaker without sample audio next time
params_infer_code = ChatTTS.Chat.InferCodeParams(
spk_smp=spk_smp,
txt_smp="第一回 灵根育孕源流出 心性修持大道生, 第二回 悟彻菩提真妙理 断魔归本合元神, 第三回 四海千山皆拱伏 九幽十类尽除名, 第四回 官封弼马心何足 名注齐天意未宁, 第五回 乱蟠桃大圣偷丹 反天宫诸神捉怪",
temperature = .000001
)
wav = chat.infer(
"四川美食确实以辣闻名,但也有不辣的选择。比如甜水面、赖汤圆、蛋烘糕、叶儿粑等,这些小吃口味温和,甜而不腻,也很受欢迎。",
params_infer_code=params_infer_code,
)
30s.wav文件里是我自己的声音读的txt_smp的内容,将这个文件转为mp3也尝试过,结果相同
以上代码的执行结果
最后用Audio(wav[0], rate=24000, autoplay=True)播放,是一段时长为0秒的噪音