基于全局变化空间及深度学习混合建模的声纹识别方法
摘要:
本发明公开一种基于全局变化空间及深度学习混合建模的声纹识别方法,包括以下步骤:获取语音段训练数据,采用全局变化空间建模的方法进行身份认证矢量,获取TVM-IVECTOR;采用深度神经网络的方法进行训练,获取NN-IVECTOR;将同一个音频文件的两个向量进行融合,得到新的I-VECTOR特征提取器;对于待测试音频,将TVM-IVECTOR和NN-IVECTOR两个向量融合后,提取最终的I-VECTOR;经过信道补偿后,与模型库中的说话人模型进行打分识别,得到识别结果。本发明方法对环境不匹配、多信道变化以及噪声等环境因素的干扰具有更强的鲁棒性,能够提高声纹识别方法的性能。
0/0