语音合成模型训练方法、语音合成方法及装置
摘要:
本公开提供一种语音合成模型训练方法、语音合成方法及装置,语音合成模型训练方法包括:获取训练文本,各个训练参考音频,以及各个基准音频;基于当前训练参考音频确定当前基准音频;获取训练文本的训练文本向量和各个训练参考音频帧向量并获取对应于当前训练参考音频的训练合成音频;根据训练合成音频和当前基准音频,获取第一损失,更新当前训练参考音频,直至获取分别与各个训练参考音频对应的各个第一损失,根据各个第一损失获取模型损失,并根据模型损失调整语音合成模型的参数,直至模型损失满足模型损失阈值,得到训练好的语音合成模型。本发明实施例提供的语音合成模型训练方法能够丰富语音合成模型的韵律风格,减少模型的使用局限性。
公开/授权文献
0/0