一种语音识别的方法和装置

发明公开

请登陆查看更多内容

专利标题： 一种语音识别的方法和装置
申请号： CN202310300312.3

申请日： 2023-03-24
公开(公告)号： CN116844534A

公开(公告)日： 2023-10-03
发明人: 李思琪 , 付立
申请人： 京东科技信息技术有限公司
申请人地址： 北京市大兴区北京经济技术开发区科创十一街18号院2号楼6层601
专利权人： 京东科技信息技术有限公司
当前专利权人： 京东科技信息技术有限公司
当前专利权人地址： 北京市大兴区北京经济技术开发区科创十一街18号院2号楼6层601
代理机构： 中原信达知识产权代理有限责任公司
代理商 孙磊; 韩黎捷
主分类号： G10L15/16
IPC分类号： G10L15/16 ; G10L15/06 ; G10L15/26

摘要：

本发明公开了一种语音识别的方法和装置，涉及人工智能技术领域。该方法的一具体实施方式包括：针对语音识别场景接收到的语音数据划分成多个语音数据块，为每一个语音数据块增加多个填充语音帧，基于填充过的语音数据块执行提取包含设定数量语音帧的语音帧组，并利用预设语音识别模型处理输入的语音帧组中的语音帧以得到识别结果；其中预设语音识别模型包含的卷积核的数量与设定数量一致；本发明的实施例克服了现有技术中由于未考虑一个语音数据块中当前帧与当前帧之后的语音帧的语音信息的关联性而导致的语音识别准确率偏低的问题，提高了语音识别的效果。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/08	.语音分类或检索
G10L15/16	..利用人工神经网络