一种声纹识别方法、装置及电子设备

发明公开

请登陆查看更多内容

专利标题： 一种声纹识别方法、装置及电子设备
申请号： CN202311785628.2

申请日： 2023-12-22
公开(公告)号： CN118173116A

公开(公告)日： 2024-06-11
发明人: 张华军 , 王淑琪 , 邓小涛 , 王征华 , 苏义鑫
申请人： 武汉理工大学 , 武汉大晟极科技有限公司
申请人地址： 湖北省武汉市洪山区珞狮路122号;
专利权人： 武汉理工大学,武汉大晟极科技有限公司
当前专利权人： 武汉理工大学,武汉大晟极科技有限公司
当前专利权人地址： 湖北省武汉市洪山区珞狮路122号;
代理机构： 武汉智嘉联合知识产权代理事务所
代理商 张璐
主分类号： G10L25/03
IPC分类号： G10L25/03 ; G10L15/06 ; G10L15/16 ; G10L17/04 ; G10L25/18 ; G10L25/30

摘要：

本发明提供了一种声纹识别方法、装置及电子设备，该方法包括：提取语音数据的声学特征，得到输入特征；确定训练完备的神经网络模型，神经网络模型包括时延神经网络模块、多尺度和非局部操作模块和相似度打分模块；基于时延神经网络模块，对输入特征的时间动态特征进行提取，得到第一特征；基于多尺度和非局部操作模块，对第一特征的多尺度局部特征和非局部特征进行提取融合，得到第二特征，基于第二特征，得到目标特征；基于相似度打分模块，计算目标特征和预设的语音特征的相似度得分，基于相似度得分，判断目标特征和预设的语音特征来源于同一人的可能性。本发明通过结合时延神经网络、多尺度和非局部操作，有效提高了声纹识别的准确性。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/03	.以提取参数类型为特征的