发明公开
- 专利标题: 一种声纹识别方法、装置及电子设备
-
申请号: CN202311785628.2申请日: 2023-12-22
-
公开(公告)号: CN118173116A公开(公告)日: 2024-06-11
- 发明人: 张华军 , 王淑琪 , 邓小涛 , 王征华 , 苏义鑫
- 申请人: 武汉理工大学 , 武汉大晟极科技有限公司
- 申请人地址: 湖北省武汉市洪山区珞狮路122号;
- 专利权人: 武汉理工大学,武汉大晟极科技有限公司
- 当前专利权人: 武汉理工大学,武汉大晟极科技有限公司
- 当前专利权人地址: 湖北省武汉市洪山区珞狮路122号;
- 代理机构: 武汉智嘉联合知识产权代理事务所
- 代理商 张璐
- 主分类号: G10L25/03
- IPC分类号: G10L25/03 ; G10L15/06 ; G10L15/16 ; G10L17/04 ; G10L25/18 ; G10L25/30
摘要:
本发明提供了一种声纹识别方法、装置及电子设备,该方法包括:提取语音数据的声学特征,得到输入特征;确定训练完备的神经网络模型,神经网络模型包括时延神经网络模块、多尺度和非局部操作模块和相似度打分模块;基于时延神经网络模块,对输入特征的时间动态特征进行提取,得到第一特征;基于多尺度和非局部操作模块,对第一特征的多尺度局部特征和非局部特征进行提取融合,得到第二特征,基于第二特征,得到目标特征;基于相似度打分模块,计算目标特征和预设的语音特征的相似度得分,基于相似度得分,判断目标特征和预设的语音特征来源于同一人的可能性。本发明通过结合时延神经网络、多尺度和非局部操作,有效提高了声纹识别的准确性。