专利检索 ap:("合肥工业大学") AND inv:"杜燕妮" 第 1 页

1.

发明公开
一种基于world-tacotron的语音合成方法、系统及服务器审中-实审

公开(公告)号：CN113129862A

公开(公告)日：2021-07-16

申请号：CN202110436317.X

申请日：2021-04-22

申请人： 合肥工业大学

发明人： 卫星 , 杜燕妮 , 翟琰 , 赵冲 , 李航 , 帅竞贤 , 沈奥 , 陆阳

IPC分类号： G10L13/02 , G10L13/04 , G10L19/16 , G10L25/30

摘要： 本发明涉及一种人工智能技术领域，提供一种基于world‑tacotron的语音合成方法、系统及服务器，本发明在现有的tacotron模型基础上，将韵律信息融入端到端声学建模过程，引入双任务学习框架，主任务为改进的tacotron模型，学习基于字符级嵌入表示的声学特征参数预测；辅助任务为韵律生成模型，即韵律生成器，学习基于词级嵌入的韵律预测。本发明在训练阶段，通过双任务的联合训练，在模型训练中可以学习到更加显示的韵律知识，从而优化了输出语音的质量。

2.

发明授权
一种基于world-tacotron的语音合成方法、系统及服务器有权

公开(公告)号：CN113129862B

公开(公告)日：2024-03-12

申请号：CN202110436317.X

申请日：2021-04-22

申请人： 合肥工业大学

发明人： 卫星 , 杜燕妮 , 翟琰 , 赵冲 , 李航 , 帅竞贤 , 沈奥 , 陆阳

IPC分类号： G10L13/02 , G10L13/04 , G10L19/16 , G10L25/30

摘要： 本发明涉及一种人工智能技术领域，提供一种基于world‑tacotron的语音合成方法、系统及服务器，本发明在现有的tacotron模型基础上，将韵律信息融入端到端声学建模过程，引入双任务学习框架，主任务为改进的tacotron模型，学习基于字符级嵌入表示的声学特征参数预测；辅助任务为韵律生成模型，即韵律生成器，学习基于词级嵌入的韵律预测。本发明在训练阶段，通过双任务的联合训练，在模型训练中可以学习到更加显示的韵律知识，从而优化了输出语音的质量。