一种多情感多说话人语音合成方法和系统
摘要:
针对现有的开源情感语音库一般规模较小进而限制情感语音合成质量的缺点,本发明提供了一种多情感多说话人语音合成方法和系统。方法包括:首先使用现有开源情感语音库训练一个语音情感分类器,去除该分类器的分类层可得到一个语音情感编码器。然后利用该语音情感编码器提取语音中的情感特征训练一个情感转换器,利用情感转换器构建出一个新的多说话人多种情感的情感语音库,最后利用构建的情感语音库和开源情感语音库训练一个情感语音生成器实现多情感多说话人语音合成。本发明依据情感转换器构建新情感语音库,再利用新情感语音库训练情感语音生成器,扩展了情感语音数据集、提升了情感语音合成质量。
公开/授权文献
0/0