语音增强方法、装置、设备和存储介质

发明公开

请登陆查看更多内容

专利标题： 语音增强方法、装置、设备和存储介质
申请号： CN202211592701.X

申请日： 2022-12-13
公开(公告)号： CN115588437A

公开(公告)日： 2023-01-10
发明人: 黄文琦 , 林全郴 , 梁凌宇 , 戴珍 , 白昱阳 , 赵翔宇 , 郭尧
申请人： 南方电网数字电网研究院有限公司
申请人地址： 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
专利权人： 南方电网数字电网研究院有限公司
当前专利权人： 南方电网数字电网研究院股份有限公司
当前专利权人地址： 510700 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
代理机构： 华进联合专利商标代理有限公司
代理商 谢曲曲
主分类号： G10L21/0208
IPC分类号： G10L21/0208 ; G10L25/30 ; G06N3/04 ; G06N3/08

摘要：

本申请涉及一种语音增强方法、装置、设备、存储介质和计算机程序产品。所述方法包括：首先，获取待处理的第一语音，第一语音含有噪声，接着，将第一语音输入至预先得到的语音增强网络中，其中，语音增强网络包括级联的分析滤波器、混合神经网络以及合成滤波器，其次，通过分析滤波器对第一语音进行短时傅里叶变换处理，得到原始傅里叶频谱，进而，通过混合神经网络对原始傅里叶频谱进行特征提取处理，得到特征数据，特征数据包括增强的傅里叶频谱或者复数掩蔽，最后，通过合成滤波器对特征数据进行短时逆傅里叶变换处理，得到去噪后的第二语音，通过本方法，可以得到去噪增强后的语音，提高语音识别能力。

公开/授权文献

CN115588437B 语音增强方法、装置、设备和存储介质公开/授权日：2023-04-07

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L21/00	为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L19/00优先）
G10L21/02	.语音增强，例如降低噪声或消除回声（在直线传送系统中减轻回声效应入H04B3/20；免提电话中的回声抑制入H04M9/08）
G10L21/0208	..噪声过滤