2
作者你好,请教一下,生成多段音频的时候,有时候每段音频听起来空间感不一样呢?比如第一段听起来声音清脆一些,第二段就肯能低沉一些,这个有什么优化的方法吗?
作者你好,请教一下,生成多段音频的时候,有时候每段音频听起来空间感不一样呢?比如第一段听起来声音清脆一些,第二段就肯能低沉一些,这个有什么优化的方法吗?
音色没固定
那如何固定呢?音色听起来是一个人,就是感觉声音的空间不一样
这是模型自身的问题导致的,原因是训练时同一个spk_emb可能对应多个人声。后续可能会调整训练数据集后发布优化的模型。