[babysor/MockingBird]中英模型怎么训练

2024-07-05 165 views
4

想要同时支持中文和英文的播报,怎么训练模型啊?

回答

5

最近开发精力不太够,只能提供个思路,目前字幕都处理成拼音了,所以只支持中文,最好是可转成ipa等音素格式,然后属于中英夹杂的语料

2

是把中文训练集的拼音转成ipa的格式吗?能提供一个简单的中英混合的训练数据格式看看吗?后面需要训练的数据自己整理。

4

大佬,我尝试用了aishell3的中文数据和train-clean-100的英文数据混合训练了,能播报中英文混合的,但是有漏读、合成的最后会多出来一点杂音,大佬能指点一下,怎么消除杂音么?下面是我加载的模型 image

5

也想了解如何中英文数据混合训练?