语音识别模型的训练方法、语音识别方法及相关装置

发明公开

CN113889086A 语音识别模型的训练方法、语音识别方法及相关装置审中-实审

请登陆查看更多内容

专利标题： 语音识别模型的训练方法、语音识别方法及相关装置
申请号： CN202111078440.5

申请日： 2021-09-15
公开(公告)号： CN113889086A

公开(公告)日： 2022-01-04
发明人: 李程帅 , 孙进伟 , 徐涛
申请人： 青岛信芯微电子科技股份有限公司
申请人地址： 山东省青岛市崂山区松岭路399号
专利权人： 青岛信芯微电子科技股份有限公司
当前专利权人： 青岛信芯微电子科技股份有限公司
当前专利权人地址： 山东省青岛市崂山区松岭路399号
代理机构： 北京同达信恒知识产权代理有限公司
代理商 王英
主分类号： G10L15/06
IPC分类号： G10L15/06 ; G10L15/02

摘要：

本申请涉及人工智能技术领域，提供一种语音识别模型的训练方法、语音识别方法及相关装置，用以解决在语音识别模型进行语音识别时准确率较低的问。本申请在将音频文件的音频特征数据输入给语音识别模型之前，对音频特征数据进行以模型感受野为间隔的掩蔽，然后将掩蔽处理后的音频特征数据输入给语音识别模型，基于音频特征数据，对语音识别模型进行训练。由于进行了本申请的掩蔽处理，使得样本包括了有上下文，没有上下文，没有上文，没有下文等多种样本，使得语音识别模型能够学习到不同情况下的识别结果。综上，本申请能够通过对音频特征数据进行等感受野间隔的掩蔽，摆脱语音识别模型对部分信息的过度依赖，提升语音识别模型的识别率。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/06	.创建基准模板；训练语音识别系统，例如对说话者声音特征的适应（G10L15/14优先）