语音识别方法、语音识别装置、电子设备及可读存储介质

发明公开

CN118197298A 语音识别方法、语音识别装置、电子设备及可读存储介质审中-实审

请登陆查看更多内容

专利标题： 语音识别方法、语音识别装置、电子设备及可读存储介质
申请号： CN202410368194.4

申请日： 2024-03-28
公开(公告)号： CN118197298A

公开(公告)日： 2024-06-14
发明人: 曹雪峰 , 张岩 , 刘妮妮 , 李阳 , 沈红星
申请人： 中移雄安信息通信科技有限公司 , 中移系统集成有限公司 , 中国移动通信集团有限公司 , 中移信息系统集成有限公司
申请人地址： 河北省保定市容城县奥威路南88号; ; ;
专利权人： 中移雄安信息通信科技有限公司,中移系统集成有限公司,中国移动通信集团有限公司,中移信息系统集成有限公司
当前专利权人： 中移雄安信息通信科技有限公司,中移系统集成有限公司,中国移动通信集团有限公司,中移信息系统集成有限公司
当前专利权人地址： 河北省保定市容城县奥威路南88号; ; ;
代理机构： 北京国昊天诚知识产权代理有限公司
代理商 叶碧莲
主分类号： G10L15/16
IPC分类号： G10L15/16 ; G10L15/02 ; G10L15/04

摘要：

本申请公开了一种语音识别方法、语音识别装置、电子设备及可读存储介质，所述方法包括：通过对待识别音频进行特征分析，得到第一融合特征；在通过对所述第一融合特征进行处理，得到与所述待识别音频对应的多个第一时间块的情况下，针对每个第一时间块，基于场景权值对所述第一时间块的长度进行调整，得到与所述第一时间块对应的第二时间块，其中，所述场景权值用于表示所述第一时间块所处场景的模糊程度；根据多个所述第二时间块重新划分所述待识别音频，得到多个第三时间块；针对每一所述第三时间块，基于所述第三时间块的声学特征和所述第三时间块的上下文嵌入向量平均值，确定与所述第三时间块对应的语音识别结果。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L15/00	语音识别（G10L17/00优先）
G10L15/08	.语音分类或检索
G10L15/16	..利用人工神经网络