发明公开
- 专利标题: 一种语音识别的方法和装置
-
申请号: CN202310300312.3申请日: 2023-03-24
-
公开(公告)号: CN116844534A公开(公告)日: 2023-10-03
- 发明人: 李思琪 , 付立
- 申请人: 京东科技信息技术有限公司
- 申请人地址: 北京市大兴区北京经济技术开发区科创十一街18号院2号楼6层601
- 专利权人: 京东科技信息技术有限公司
- 当前专利权人: 京东科技信息技术有限公司
- 当前专利权人地址: 北京市大兴区北京经济技术开发区科创十一街18号院2号楼6层601
- 代理机构: 中原信达知识产权代理有限责任公司
- 代理商 孙磊; 韩黎捷
- 主分类号: G10L15/16
- IPC分类号: G10L15/16 ; G10L15/06 ; G10L15/26
摘要:
本发明公开了一种语音识别的方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:针对语音识别场景接收到的语音数据划分成多个语音数据块,为每一个语音数据块增加多个填充语音帧,基于填充过的语音数据块执行提取包含设定数量语音帧的语音帧组,并利用预设语音识别模型处理输入的语音帧组中的语音帧以得到识别结果;其中预设语音识别模型包含的卷积核的数量与设定数量一致;本发明的实施例克服了现有技术中由于未考虑一个语音数据块中当前帧与当前帧之后的语音帧的语音信息的关联性而导致的语音识别准确率偏低的问题,提高了语音识别的效果。