语音合成模型训练方法、语音合成方法及装置

发明授权

请登陆查看更多内容

专利标题： 语音合成模型训练方法、语音合成方法及装置
申请号： CN202110641756.4

申请日： 2021-06-09
公开(公告)号： CN113096638B

公开(公告)日： 2021-09-07
发明人: 汪光璟 , 李成飞 , 杨嵩
申请人： 北京世纪好未来教育科技有限公司
申请人地址： 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
专利权人： 北京世纪好未来教育科技有限公司
当前专利权人： 北京世纪好未来教育科技有限公司
当前专利权人地址： 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室
代理机构： 上海知锦知识产权代理事务所
代理商 张文娟; 李丽
主分类号： G10L13/02
IPC分类号： G10L13/02 ; G10L13/027

摘要：

本公开提供一种语音合成模型训练方法、语音合成方法及装置，语音合成模型训练方法包括：获取训练文本，各个训练参考音频，以及各个基准音频；基于当前训练参考音频确定当前基准音频；获取训练文本的训练文本向量和各个训练参考音频帧向量并获取对应于当前训练参考音频的训练合成音频；根据训练合成音频和当前基准音频，获取第一损失，更新当前训练参考音频，直至获取分别与各个训练参考音频对应的各个第一损失，根据各个第一损失获取模型损失，并根据模型损失调整语音合成模型的参数，直至模型损失满足模型损失阈值，得到训练好的语音合成模型。本发明实施例提供的语音合成模型训练方法能够丰富语音合成模型的韵律风格，减少模型的使用局限性。

公开/授权文献

CN113096638A 语音合成模型训练方法、语音合成方法及装置公开/授权日：2021-07-09

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L13/00	语音合成；文本-语音合成系统
G10L13/02	.产生合成语音的方法；语音合成设备