发明公开
- 专利标题: 语音识别方法、语音识别装置、电子设备及可读存储介质
-
申请号: CN202410368194.4申请日: 2024-03-28
-
公开(公告)号: CN118197298A公开(公告)日: 2024-06-14
- 发明人: 曹雪峰 , 张岩 , 刘妮妮 , 李阳 , 沈红星
- 申请人: 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
- 申请人地址: 河北省保定市容城县奥威路南88号; ; ;
- 专利权人: 中移雄安信息通信科技有限公司,中移系统集成有限公司,中国移动通信集团有限公司,中移信息系统集成有限公司
- 当前专利权人: 中移雄安信息通信科技有限公司,中移系统集成有限公司,中国移动通信集团有限公司,中移信息系统集成有限公司
- 当前专利权人地址: 河北省保定市容城县奥威路南88号; ; ;
- 代理机构: 北京国昊天诚知识产权代理有限公司
- 代理商 叶碧莲
- 主分类号: G10L15/16
- IPC分类号: G10L15/16 ; G10L15/02 ; G10L15/04
摘要:
本申请公开了一种语音识别方法、语音识别装置、电子设备及可读存储介质,所述方法包括:通过对待识别音频进行特征分析,得到第一融合特征;在通过对所述第一融合特征进行处理,得到与所述待识别音频对应的多个第一时间块的情况下,针对每个第一时间块,基于场景权值对所述第一时间块的长度进行调整,得到与所述第一时间块对应的第二时间块,其中,所述场景权值用于表示所述第一时间块所处场景的模糊程度;根据多个所述第二时间块重新划分所述待识别音频,得到多个第三时间块;针对每一所述第三时间块,基于所述第三时间块的声学特征和所述第三时间块的上下文嵌入向量平均值,确定与所述第三时间块对应的语音识别结果。