一种基于声纹比对和生成对抗网络的语音增强方法
摘要:
本发明公开一种基于声纹比对和生成对抗网络的语音增强方法,1)建立三个语音数据库,分别对应声纹识别编码器、噪声分离系统和语音分离系统;2)训练声纹识别编码器提取目标说话者的声纹特征,得目标声纹特征;3)将带噪音频转化成语谱图送入噪声分离系统中的生成器中,得预测干净音频;4)将预测干净音频和真实干净音频送入噪声分离系统中的鉴别器训练;5)调整鉴别器权重参数,使鉴别器更好地分辨出真实干净音频和预测干净音频的区别,得到产生近乎真实的干净音频的生成器;6)将说话者的声音送入已经训练好的生成器中,生成预测干净语谱图,得到增强的语音信号。该方法规模小、计算低、易于移植、保持一定的空间不变性且去噪效果好。
0/0