-
公开(公告)号:CN117542368A
公开(公告)日:2024-02-09
申请号:CN202311503287.5
申请日:2023-11-13
Applicant: 辽宁工业大学
IPC: G10L21/0216 , G10L21/0224 , G10L21/0232
Abstract: 本发明公开一种基于CRG‑MGAN网络的语音增强方法,包括:获取含噪语音的包含时域和频域的压缩复谱图;将压缩复谱图输入CRG‑MGAN生成器中生成增强语音;CRG‑MGAN生成器包括编码器、CRGU模块以及解码器;将压缩复谱图输入编码器中获得频域特征和时域特征;将频域特征和时域特征分别送入CRGU模块中进行进一步特征提取;通过解码器以解耦的方式从CRGU模块中提取输出,解码器包括掩码解码器和复解码器两条路径,根据两条路径得到合成的增强语音;利用度量鉴别器判断增强语音。本发明提高了增强语音的质量,在保证特征提取的效率的同时降低了计算复杂性,提高了模型的训练速度。