- 专利标题: 基于Transformer模型的局部信息融合的语音识别网络及方法、终端
-
申请号: CN202111673373.1申请日: 2021-12-31
-
公开(公告)号: CN114333824A公开(公告)日: 2022-04-12
- 发明人: 陈嘉维 , 段志奎 , 于昕梅 , 阮锦标 , 高国智 , 王虎伟 , 严世泉
- 申请人: 佛山科学技术学院
- 申请人地址: 广东省佛山市南海区狮山镇仙溪水库西路佛山科学技术学院
- 专利权人: 佛山科学技术学院
- 当前专利权人: 佛山大学
- 当前专利权人地址: 528225 广东省佛山市南海区狮山镇仙溪水库西路佛山科学技术学院
- 代理机构: 广州新诺专利商标事务所有限公司
- 代理商 林玉芳
- 主分类号: G10L15/22
- IPC分类号: G10L15/22 ; G10L15/26 ; G10L15/16
摘要:
本发明提供一种基于Transformer模型的局部信息融合的语音识别网络,包括编码器及解码器,其特征在于,所述编码器的多头注意力模块MHA,解码器的多头交叉注意力模块MHCA上使用受限范围内的局部特征掩码LFMRS。本发明还提供一种基于Transformer模型的局部信息融合的语音识别方法和终端设备。弥补了原始Transformer模型缺乏显性地提取局部特征的缺陷,有效地降低了语音识别的CER值。