语音合成的多任务模型训练方法及相关设备

发明公开

CN111951780A 语音合成的多任务模型训练方法及相关设备审中-实审

请登陆查看更多内容

专利标题： 语音合成的多任务模型训练方法及相关设备
申请号： CN202010839731.0

申请日： 2020-08-19
公开(公告)号： CN111951780A

公开(公告)日： 2020-11-17
发明人: 贺天威 , 周鸿斌 , 戴长军 , 黄杰雄
申请人： 广州华多网络科技有限公司
申请人地址： 广东省广州市番禺区南村镇万博商务区万达广场B-1栋29层
专利权人： 广州华多网络科技有限公司
当前专利权人： 广州华多网络科技有限公司
当前专利权人地址： 广东省广州市番禺区南村镇万博商务区万达广场B-1栋29层
代理机构： 北京市立方律师事务所
代理商 刘延喜
主分类号： G10L13/02
IPC分类号： G10L13/02 ; G10L13/08

摘要：

本申请涉及语音合成技术领域，提供了一种语音合成的多任务模型训练方法及相关设备，该方法包括：设定至少两个序列标注任务，以处理语音合成中的文本分析；根据序列标注任务构建包括多任务输出层的多任务模型，将多任务输出层配置为将目标文本信息作为各项序列标注任务独立的输入并输出各项序列标注任务对应的标签序列；获取样本信息，样本信息包括训练文本信息，以及训练文本信息与各项序列标注任务对应的训练标签序列；采用样本信息对多任务模型进行训练，得到语音合成前端处理的多任务模型。本申请将各项序列标注任务整合在同一多任务模型中，有利于简化模型的训练流程。

公开/授权文献

CN111951780B 语音合成的多任务模型训练方法及相关设备公开/授权日：2023-06-13

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L13/00	语音合成；文本-语音合成系统
G10L13/02	.产生合成语音的方法；语音合成设备