Q

[2noise/ChatTTS]作者你好，请教一下，生成多段音频的时候，有时候每段音频听起来空间感不一样呢？比如第一段听起来声音清脆一些，第二段听起来低沉一些

chattts

2024-10-17 678 views 4 likes

1

作者你好，请教一下，生成多段音频的时候，有时候每段音频听起来空间感不一样呢？比如第一段听起来声音清脆一些，第二段就肯能低沉一些，这个有什么优化的方法吗？

xiaoxiaotestnote

A

回答

5

音色没固定

heart18z

2

那如何固定呢？音色听起来是一个人，就是感觉声音的空间不一样

xiaoxiaotestnote

8

这是模型自身的问题导致的，原因是训练时同一个spk_emb可能对应多个人声。后续可能会调整训练数据集后发布优化的模型。

fumiama