发明公开
- 专利标题: 一种多情感多说话人语音合成方法和系统
-
申请号: CN202410006409.8申请日: 2024-01-03
-
公开(公告)号: CN117496944A公开(公告)日: 2024-02-02
- 发明人: 杨继臣 , 夏佳奇 , 王泳 , 伍均达
- 申请人: 广东技术师范大学
- 申请人地址: 广东省广州市天河区中山大道西293号
- 专利权人: 广东技术师范大学
- 当前专利权人: 广东技术师范大学
- 当前专利权人地址: 广东省广州市天河区中山大道西293号
- 代理机构: 佛山粤进知识产权代理事务所
- 代理商 耿鹏
- 主分类号: G10L13/027
- IPC分类号: G10L13/027
摘要:
针对现有的开源情感语音库一般规模较小进而限制情感语音合成质量的缺点,本发明提供了一种多情感多说话人语音合成方法和系统。方法包括:首先使用现有开源情感语音库训练一个语音情感分类器,去除该分类器的分类层可得到一个语音情感编码器。然后利用该语音情感编码器提取语音中的情感特征训练一个情感转换器,利用情感转换器构建出一个新的多说话人多种情感的情感语音库,最后利用构建的情感语音库和开源情感语音库训练一个情感语音生成器实现多情感多说话人语音合成。本发明依据情感转换器构建新情感语音库,再利用新情感语音库训练情感语音生成器,扩展了情感语音数据集、提升了情感语音合成质量。
公开/授权文献
- CN117496944B 一种多情感多说话人语音合成方法和系统 公开/授权日:2024-03-22