发明公开
- 专利标题: 语音识别模型的训练方法、语音识别方法及相关装置
-
申请号: CN202111078440.5申请日: 2021-09-15
-
公开(公告)号: CN113889086A公开(公告)日: 2022-01-04
- 发明人: 李程帅 , 孙进伟 , 徐涛
- 申请人: 青岛信芯微电子科技股份有限公司
- 申请人地址: 山东省青岛市崂山区松岭路399号
- 专利权人: 青岛信芯微电子科技股份有限公司
- 当前专利权人: 青岛信芯微电子科技股份有限公司
- 当前专利权人地址: 山东省青岛市崂山区松岭路399号
- 代理机构: 北京同达信恒知识产权代理有限公司
- 代理商 王英
- 主分类号: G10L15/06
- IPC分类号: G10L15/06 ; G10L15/02
摘要:
本申请涉及人工智能技术领域,提供一种语音识别模型的训练方法、语音识别方法及相关装置,用以解决在语音识别模型进行语音识别时准确率较低的问。本申请在将音频文件的音频特征数据输入给语音识别模型之前,对音频特征数据进行以模型感受野为间隔的掩蔽,然后将掩蔽处理后的音频特征数据输入给语音识别模型,基于音频特征数据,对语音识别模型进行训练。由于进行了本申请的掩蔽处理,使得样本包括了有上下文,没有上下文,没有上文,没有下文等多种样本,使得语音识别模型能够学习到不同情况下的识别结果。综上,本申请能够通过对音频特征数据进行等感受野间隔的掩蔽,摆脱语音识别模型对部分信息的过度依赖,提升语音识别模型的识别率。