语音合成方法、系统、语音合成模型及其训练方法

发明公开

CN113948061A 语音合成方法、系统、语音合成模型及其训练方法审中-实审

请登陆查看更多内容

专利标题： 语音合成方法、系统、语音合成模型及其训练方法
申请号： CN202111205560.7

申请日： 2021-10-15
公开(公告)号： CN113948061A

公开(公告)日： 2022-01-18
发明人: 司马华鹏 , 毛志强
申请人： 宿迁硅基智能科技有限公司
申请人地址： 江苏省宿迁市湖滨新区保险小镇B19栋201室
专利权人： 宿迁硅基智能科技有限公司
当前专利权人： 宿迁硅基智能科技有限公司
当前专利权人地址： 江苏省宿迁市湖滨新区保险小镇B19栋201室
代理机构： 北京弘权知识产权代理有限公司
代理商 逯长明; 许伟群
主分类号： G10L13/08
IPC分类号： G10L13/08 ; G10L13/10 ; G10L25/63

摘要：

本申请提供一种语音合成方法、系统、语音合成模型及其训练方法，所述方法包括获取目标文本和目标文本的第一瓶颈特征；获取参考音频库，参考音频库包括若干参考音频；获取参考音频库中每一个参考音频对应的参考文本，以及，获取每一个参考文本的第二瓶颈特征；计算第一瓶颈特征与每一个参考文本的第二瓶颈特征的相似度，将与第一瓶颈特征相似度最高的第二瓶颈特征对应的参考文本确定为文本模板；将文本模板对应的参考音频确定为音频模板；将音频模板和目标文本输入预先训练的语音合成模型中，以合成具备深度情感层次特征的语音。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L13/00	语音合成；文本-语音合成系统
G10L13/08	.文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定