基于复数坐标注意力的语音增强方法、系统、设备及介质
摘要:
本发明公开了一种基于复数坐标注意力的语音增强方法、系统、设备及介质,涉及语音处理领域,该方法包括将原始语音从时域转换到时频域;采用编码器对原始语音的时频域表示进行特征提取;编码器包括多个依次连接的编码块,各编码块均包括依次连接的复数卷积层、复数批归一化层、实数激活函数和复数坐标注意力模块;采用解码器对编码器中每个编码块输出的特征图进行解码,生成频谱掩码;解码器包括多个依次连接的解码块,各解码块均包括依次连接的复数转置卷积层、复数批归一化层、实数激活函数和复数坐标注意力模块;将频谱掩码与原始语音的时频域表示进行逐点相乘后进行时域转换,获得增强后的语音。本发明提高了语音增强后语音的质量。
0/0