-
公开(公告)号:CN115171710B
公开(公告)日:2024-10-29
申请号:CN202210799728.X
申请日:2022-07-08
IPC分类号: G10L21/007 , G10L21/0224 , G10L21/0232 , G10L19/02 , G10L25/63 , G06N3/045 , G06N3/0464 , G06N3/094 , G06N3/0475 , G06N3/084 , G10L25/30
摘要: 本发明属于语音信号处理的语音增强技术领域,提供了一种基于多角度判别的生成对抗网络的语音增强方法及系统。该方法包括,获取带噪声语音信号;基于带噪声语音信号,采用训练好的生成对抗网络,得到增强后的语音信号;其中,所述生成对抗网络包括一个生成器和四个判别器。本发明的多角度判别包括:增强后语音信号、干净语音与情绪语音之间的差异;同时添加从频域判别学习增强后语音信号、干净语音与情绪语音之间的频域差异。本发明从不同语音信号的语音成分进行判别,以及语音的时域频域角度,能够从不同角度充分学习语音成分,为生成器提供足够多的反馈信息,可以有效改善语音失真,提高增强后语音的语音质量。
-
公开(公告)号:CN115171642A
公开(公告)日:2022-10-11
申请号:CN202210795721.0
申请日:2022-07-07
申请人: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC分类号: G10K11/178 , G06N3/08 , G06N3/04
摘要: 本发明属于主动降噪技术领域,提供了一种基于改进的循环神经网络的主动降噪方法及系统,该方法包括获取待降噪信号数据;基于待降噪信号数据和训练好的改进的循环神经网络模型对噪声信号进行滤波控制,生成滤波后的信号;其中,所述改进的循环神经网络模型的构建过程为:采用门控循环单元替换传统循环神经网络中的隐藏单元中的tanh函数,形成了一个带有门控的RNN网络,同时使用遗忘门和记忆门对具有时间相关性的噪声信号进行处理;对滤波后的信号通过次级路径模型模拟得到抗噪声信号;依据相消干涉原理,根据抗噪声信号对噪声信号进行消除得到去噪后的信号。不仅保证了信号的时间相关性,而且提高了训练效率。
-
公开(公告)号:CN115171710A
公开(公告)日:2022-10-11
申请号:CN202210799728.X
申请日:2022-07-08
申请人: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学
IPC分类号: G10L21/007 , G10L21/0224 , G10L21/0232 , G10L19/02 , G10L25/63 , G06N3/08 , G06N3/04
摘要: 本发明属于语音信号处理的语音增强技术领域,提供了一种基于多角度判别的生成对抗网络的语音增强方法及系统。该方法包括,获取带噪声语音信号;基于带噪声语音信号,采用训练好的生成对抗网络,得到增强后的语音信号;其中,所述生成对抗网络包括一个生成器和四个判别器。本发明的多角度判别包括:增强后语音信号、干净语音与情绪语音之间的差异;同时添加从频域判别学习增强后语音信号、干净语音与情绪语音之间的频域差异。本发明从不同语音信号的语音成分进行判别,以及语音的时域频域角度,能够从不同角度充分学习语音成分,为生成器提供足够多的反馈信息,可以有效改善语音失真,提高增强后语音的语音质量。
-
公开(公告)号:CN115171642B
公开(公告)日:2024-10-29
申请号:CN202210795721.0
申请日:2022-07-07
IPC分类号: G10K11/178 , G06N3/08 , G06N3/044
摘要: 本发明属于主动降噪技术领域,提供了一种基于改进的循环神经网络的主动降噪方法及系统,该方法包括获取待降噪信号数据;基于待降噪信号数据和训练好的改进的循环神经网络模型对噪声信号进行滤波控制,生成滤波后的信号;其中,所述改进的循环神经网络模型的构建过程为:采用门控循环单元替换传统循环神经网络中的隐藏单元中的tanh函数,形成了一个带有门控的RNN网络,同时使用遗忘门和记忆门对具有时间相关性的噪声信号进行处理;对滤波后的信号通过次级路径模型模拟得到抗噪声信号;依据相消干涉原理,根据抗噪声信号对噪声信号进行消除得到去噪后的信号。不仅保证了信号的时间相关性,而且提高了训练效率。
-
公开(公告)号:CN114664318A
公开(公告)日:2022-06-24
申请号:CN202210301250.3
申请日:2022-03-25
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G10L21/0208 , G10L25/30 , G06N3/04 , G06N3/08
摘要: 本发明公开了基于生成对抗网络的语音增强方法及系统,包括:获取带噪声语音信号;将带噪声语音信号,输入到训练后的生成对抗网络中,输出增强后的语音信号;其中,所述生成对抗网络,包括两个生成器和两个判别器;所述生成对抗网络,训练过程中通过对两个生成器与两个判别器的相互博弈,提升生成器逼近目标信号的能力。本发明充分考虑了语音信号的时序关系,改进了先前的生成器与判别器的全卷积的设计,生成器中添加使用多头注意力机制,并将多生成器多阶段增强与注意力机制相结合,充分利用了多头注意力机制与生成对抗网络博弈思想。本方法能够是增强后的语音具有更高的质量与可懂度。
-
公开(公告)号:CN114627847A
公开(公告)日:2022-06-14
申请号:CN202210231973.0
申请日:2022-03-09
申请人: 山东省计算中心(国家超级计算济南中心)
IPC分类号: G10K11/178 , G10L21/0216 , G10L25/30
摘要: 本发明属于主动降噪技术领域,提供了一种基于频谱映射的主动降噪方法及系统,基于频谱映射,将噪声信号或者到噪声的语音信号输入LSTM网络对噪声信号或者带噪声语音信号中的噪声信号的频谱进行映射输出,根据相消干涉原理对噪声进行抵消,达到在误差麦克风处降低噪声声压级的目的,最后将误差信号用于计算损失函数并反馈给LSTM网络,直至网络损失函数最小并达到收敛状态,此方法将深度学习的知识用于主动降噪领域,不但提高了降噪效果,并且降低了传统信号处理方法对硬件设备的依赖问题。
-
-
-
-
-