Patent search ap:("辽宁工业大学") AND inv:"张文卓" Page 1

1.

发明公开
一种基于CRG-MGAN网络的语音增强方法审中-实审

公开(公告)号：CN117542368A

公开(公告)日：2024-02-09

申请号：CN202311503287.5

申请日：2023-11-13

Applicant: 辽宁工业大学

Inventor： 于玲 , 张文卓 , 刘熙 , 李润卿 , 张娜 , 孙淑美

IPC: G10L21/0216 , G10L21/0224 , G10L21/0232

Abstract: 本发明公开一种基于CRG‑MGAN网络的语音增强方法，包括：获取含噪语音的包含时域和频域的压缩复谱图；将压缩复谱图输入CRG‑MGAN生成器中生成增强语音；CRG‑MGAN生成器包括编码器、CRGU模块以及解码器；将压缩复谱图输入编码器中获得频域特征和时域特征；将频域特征和时域特征分别送入CRGU模块中进行进一步特征提取；通过解码器以解耦的方式从CRGU模块中提取输出，解码器包括掩码解码器和复解码器两条路径，根据两条路径得到合成的增强语音；利用度量鉴别器判断增强语音。本发明提高了增强语音的质量，在保证特征提取的效率的同时降低了计算复杂性，提高了模型的训练速度。

Patent Agency Ranking