发明公开
- 专利标题: 基于全局变化空间及深度学习混合建模的声纹识别方法
- 专利标题(英): Voiceprint identification method based on global change space and deep learning hybrid modeling
-
申请号: CN201610000675.5申请日: 2016-01-04
-
公开(公告)号: CN105575394A公开(公告)日: 2016-05-11
- 发明人: 徐明星 , 车浩
- 申请人: 北京时代瑞朗科技有限公司
- 申请人地址: 北京市海淀区上地东路35号颐泉汇写字楼B座318
- 专利权人: 北京时代瑞朗科技有限公司
- 当前专利权人: 极限元(北京)智能科技股份有限公司
- 当前专利权人地址: 北京市海淀区上地东路35号颐泉汇写字楼B座318
- 主分类号: G10L17/10
- IPC分类号: G10L17/10 ; G10L17/04 ; G10L17/02
摘要:
本发明公开一种基于全局变化空间及深度学习混合建模的声纹识别方法,包括以下步骤:获取语音段训练数据,采用全局变化空间建模的方法进行身份认证矢量,获取TVM-IVECTOR;采用深度神经网络的方法进行训练,获取NN-IVECTOR;将同一个音频文件的两个向量进行融合,得到新的I-VECTOR特征提取器;对于待测试音频,将TVM-IVECTOR和NN-IVECTOR两个向量融合后,提取最终的I-VECTOR;经过信道补偿后,与模型库中的说话人模型进行打分识别,得到识别结果。本发明方法对环境不匹配、多信道变化以及噪声等环境因素的干扰具有更强的鲁棒性,能够提高声纹识别方法的性能。