一种基于双判别器生成对抗网络的蒙古语语音识别方法

发明公开

CN116564276A 一种基于双判别器生成对抗网络的蒙古语语音识别方法有权

请登陆查看更多内容

专利标题： 一种基于双判别器生成对抗网络的蒙古语语音识别方法
申请号： CN202310437519.5

申请日： 2023-04-23
公开(公告)号： CN116564276A

公开(公告)日： 2023-08-08
发明人: 王洪彬 , 孙佳琦 , 马志强 , 王嘉泰 , 李晋益 , 刘志强
申请人： 内蒙古工业大学
申请人地址： 内蒙古自治区呼和浩特市土默特左旗金川区内蒙古工业大学
专利权人： 内蒙古工业大学
当前专利权人： 内蒙古工业大学
当前专利权人地址： 内蒙古自治区呼和浩特市土默特左旗金川区内蒙古工业大学
代理机构： 北京睿智保诚专利代理事务所
代理商 刘刚
主分类号： G10L15/02
IPC分类号： G10L15/02 ; G10L15/06 ; G10L15/16 ; G10L25/18

摘要：

本发明公开了一种基于双判别器生成对抗网络的蒙古语语音识别方法，应用于蒙古语语音识别领域，包括：语音生成器根据域外说话人特征和蒙古语文本序列，生成域外说话人蒙古语语音；目标特征判别器根据域外说话人特征和域外说话人蒙古语语音的说话人特征，输出第一判定结果；辅助特征判别器根据蒙古语文本序列对应的Mel频谱图和域外说话人蒙古语语音的Mel频谱图，输出第二判定结果；根据判定结果对语音生成器的参数调整优化，得到基于双判别器生成对抗网络的语音数据增广模型；输入待测集至语音数据增广模型，得到蒙古语语音识别结果。本发明在保证生成语音满足域外说话人特征的情况下，减少了生成语音中的误读现象，提高了语音识别准确率。

公开/授权文献

CN116564276B 一种基于双判别器生成对抗网络的蒙古语语音识别方法公开/授权日：2024-06-25

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/02	.语音识别的特征提取；识别单位的选择