发明授权
- 专利标题: 语音增强方法、装置、设备和存储介质
-
申请号: CN202211592701.X申请日: 2022-12-13
-
公开(公告)号: CN115588437B公开(公告)日: 2023-04-07
- 发明人: 黄文琦 , 林全郴 , 梁凌宇 , 戴珍 , 白昱阳 , 赵翔宇 , 郭尧
- 申请人: 南方电网数字电网研究院有限公司
- 申请人地址: 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
- 专利权人: 南方电网数字电网研究院有限公司
- 当前专利权人: 南方电网数字电网研究院股份有限公司
- 当前专利权人地址: 510700 广东省广州市黄埔区中新广州知识城亿创街1号406房之86
- 代理机构: 华进联合专利商标代理有限公司
- 代理商 谢曲曲
- 主分类号: G10L21/0208
- IPC分类号: G10L21/0208 ; G10L25/30 ; G06N3/0464 ; G06N3/0442 ; G06N3/08
摘要:
本申请涉及一种语音增强方法、装置、设备、存储介质和计算机程序产品。所述方法包括:首先,获取待处理的第一语音,第一语音含有噪声,接着,将第一语音输入至预先得到的语音增强网络中,其中,语音增强网络包括级联的分析滤波器、混合神经网络以及合成滤波器,其次,通过分析滤波器对第一语音进行短时傅里叶变换处理,得到原始傅里叶频谱,进而,通过混合神经网络对原始傅里叶频谱进行特征提取处理,得到特征数据,特征数据包括增强的傅里叶频谱或者复数掩蔽,最后,通过合成滤波器对特征数据进行短时逆傅里叶变换处理,得到去噪后的第二语音,通过本方法,可以得到去噪增强后的语音,提高语音识别能力。
公开/授权文献
- CN115588437A 语音增强方法、装置、设备和存储介质 公开/授权日:2023-01-10