发明公开
- 专利标题: 语音合成的多任务模型训练方法及相关设备
-
申请号: CN202010839731.0申请日: 2020-08-19
-
公开(公告)号: CN111951780A公开(公告)日: 2020-11-17
- 发明人: 贺天威 , 周鸿斌 , 戴长军 , 黄杰雄
- 申请人: 广州华多网络科技有限公司
- 申请人地址: 广东省广州市番禺区南村镇万博商务区万达广场B-1栋29层
- 专利权人: 广州华多网络科技有限公司
- 当前专利权人: 广州华多网络科技有限公司
- 当前专利权人地址: 广东省广州市番禺区南村镇万博商务区万达广场B-1栋29层
- 代理机构: 北京市立方律师事务所
- 代理商 刘延喜
- 主分类号: G10L13/02
- IPC分类号: G10L13/02 ; G10L13/08
摘要:
本申请涉及语音合成技术领域,提供了一种语音合成的多任务模型训练方法及相关设备,该方法包括:设定至少两个序列标注任务,以处理语音合成中的文本分析;根据序列标注任务构建包括多任务输出层的多任务模型,将多任务输出层配置为将目标文本信息作为各项序列标注任务独立的输入并输出各项序列标注任务对应的标签序列;获取样本信息,样本信息包括训练文本信息,以及训练文本信息与各项序列标注任务对应的训练标签序列;采用样本信息对多任务模型进行训练,得到语音合成前端处理的多任务模型。本申请将各项序列标注任务整合在同一多任务模型中,有利于简化模型的训练流程。
公开/授权文献
- CN111951780B 语音合成的多任务模型训练方法及相关设备 公开/授权日:2023-06-13