一种基于对抗训练的端到端的语音识别方法

发明公开

CN113257240A 一种基于对抗训练的端到端的语音识别方法审中-实审

请登陆查看更多内容

专利标题： 一种基于对抗训练的端到端的语音识别方法
申请号： CN202011190877.3

申请日： 2020-10-30
公开(公告)号： CN113257240A

公开(公告)日： 2021-08-13
发明人: 李妍 , 孟洁 , 何金 , 刘晨 , 王梓蒴 , 张旭 , 张倩宜 , 孙轶凡 , 吴凯 , 包磊 , 孟兆娜 , 赵迪
申请人： 国网天津市电力公司 , 国家电网有限公司
申请人地址： 天津市河北区五经路39号;
专利权人： 国网天津市电力公司,国家电网有限公司
当前专利权人： 国网天津市电力公司,国家电网有限公司
当前专利权人地址： 天津市河北区五经路39号;
代理机构： 天津创智天诚知识产权代理事务所
代理商 李玲
主分类号： G10L15/20
IPC分类号： G10L15/20 ; G10L15/08 ; G10L15/16 ; G10L15/06

摘要：

本发明公开了基于对抗训练的端到端的语音识别方法，其语音识别模型包括编码层和解码层，所述编码层包括卷积神经网络和自注意力机制，所述解码层为自注意力机制。该语音识别模型使用卷积神经网络构建编码层，同时引入自注意力机制，以获取局部特征，提升识别准确度。在使用该语音识别模型的语音识别方法，在识别过程中，由于频域表示的音频数据受音调、音色影响很小，因此使用频域表示来表示音频数据以降低音调音色影响，提高识别准确度。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/20	.专门适用于不利环境（例如，噪音环境）中保持鲁棒性或增强语音强度的语音识别技术（G10L21/02优先）