一种噪声环境下说话人识别模型构建方法
摘要:
本发明公开了一种噪声环境下说话人识别模型构建方法,在说话人识别网络前端增加一个去噪模块,使用改进的谱减法对带噪语音进行去噪。针对谱减法的两个参数(过减因子α和谱下限参数β),使用梯度下降的方法由神经网络动态调整两个参数的值,保留更符合说话人识别任务的语音信息,从而提高了噪声环境下说话人识别的准确率。带噪语音信号选择变窗长的窗函数进行短时傅里叶变换,可以防止频谱泄露说话人识别任务需要的说话人信息。
公开/授权文献
0/0