一种基于CRG-MGAN网络的语音增强方法

    公开(公告)号:CN117542368A

    公开(公告)日:2024-02-09

    申请号:CN202311503287.5

    申请日:2023-11-13

    Abstract: 本发明公开一种基于CRG‑MGAN网络的语音增强方法,包括:获取含噪语音的包含时域和频域的压缩复谱图;将压缩复谱图输入CRG‑MGAN生成器中生成增强语音;CRG‑MGAN生成器包括编码器、CRGU模块以及解码器;将压缩复谱图输入编码器中获得频域特征和时域特征;将频域特征和时域特征分别送入CRGU模块中进行进一步特征提取;通过解码器以解耦的方式从CRGU模块中提取输出,解码器包括掩码解码器和复解码器两条路径,根据两条路径得到合成的增强语音;利用度量鉴别器判断增强语音。本发明提高了增强语音的质量,在保证特征提取的效率的同时降低了计算复杂性,提高了模型的训练速度。

Patent Agency Ranking