发明公开
- 专利标题: 一种基于对抗训练的端到端的语音识别方法
-
申请号: CN202011190877.3申请日: 2020-10-30
-
公开(公告)号: CN113257240A公开(公告)日: 2021-08-13
- 发明人: 李妍 , 孟洁 , 何金 , 刘晨 , 王梓蒴 , 张旭 , 张倩宜 , 孙轶凡 , 吴凯 , 包磊 , 孟兆娜 , 赵迪
- 申请人: 国网天津市电力公司 , 国家电网有限公司
- 申请人地址: 天津市河北区五经路39号;
- 专利权人: 国网天津市电力公司,国家电网有限公司
- 当前专利权人: 国网天津市电力公司,国家电网有限公司
- 当前专利权人地址: 天津市河北区五经路39号;
- 代理机构: 天津创智天诚知识产权代理事务所
- 代理商 李玲
- 主分类号: G10L15/20
- IPC分类号: G10L15/20 ; G10L15/08 ; G10L15/16 ; G10L15/06
摘要:
本发明公开了基于对抗训练的端到端的语音识别方法,其语音识别模型包括编码层和解码层,所述编码层包括卷积神经网络和自注意力机制,所述解码层为自注意力机制。该语音识别模型使用卷积神经网络构建编码层,同时引入自注意力机制,以获取局部特征,提升识别准确度。在使用该语音识别模型的语音识别方法,在识别过程中,由于频域表示的音频数据受音调、音色影响很小,因此使用频域表示来表示音频数据以降低音调音色影响,提高识别准确度。