基于生成对抗网络的语音增强方法及系统

    公开(公告)号:CN114664318A

    公开(公告)日:2022-06-24

    申请号:CN202210301250.3

    申请日:2022-03-25

    摘要: 本发明公开了基于生成对抗网络的语音增强方法及系统,包括:获取带噪声语音信号;将带噪声语音信号,输入到训练后的生成对抗网络中,输出增强后的语音信号;其中,所述生成对抗网络,包括两个生成器和两个判别器;所述生成对抗网络,训练过程中通过对两个生成器与两个判别器的相互博弈,提升生成器逼近目标信号的能力。本发明充分考虑了语音信号的时序关系,改进了先前的生成器与判别器的全卷积的设计,生成器中添加使用多头注意力机制,并将多生成器多阶段增强与注意力机制相结合,充分利用了多头注意力机制与生成对抗网络博弈思想。本方法能够是增强后的语音具有更高的质量与可懂度。

    一种基于频谱映射的主动降噪方法及系统

    公开(公告)号:CN114627847A

    公开(公告)日:2022-06-14

    申请号:CN202210231973.0

    申请日:2022-03-09

    摘要: 本发明属于主动降噪技术领域,提供了一种基于频谱映射的主动降噪方法及系统,基于频谱映射,将噪声信号或者到噪声的语音信号输入LSTM网络对噪声信号或者带噪声语音信号中的噪声信号的频谱进行映射输出,根据相消干涉原理对噪声进行抵消,达到在误差麦克风处降低噪声声压级的目的,最后将误差信号用于计算损失函数并反馈给LSTM网络,直至网络损失函数最小并达到收敛状态,此方法将深度学习的知识用于主动降噪领域,不但提高了降噪效果,并且降低了传统信号处理方法对硬件设备的依赖问题。