一种面向语音识别的语音增强方法

发明授权

请登陆查看更多内容

专利标题： 一种面向语音识别的语音增强方法
申请号： CN201911180882.3

申请日： 2019-11-27
公开(公告)号： CN110970044B

公开(公告)日： 2022-06-07
发明人: 杨玉红 , 冯佳倩 , 蔡林君 , 涂卫平 , 艾浩军 , 高戈
申请人： 武汉大学
申请人地址： 湖北省武汉市武昌区珞珈山武汉大学
专利权人： 武汉大学
当前专利权人： 武汉大学
当前专利权人地址： 湖北省武汉市武昌区珞珈山武汉大学
代理机构： 武汉科皓知识产权代理事务所
代理商 严彦
主分类号： G10L21/02
IPC分类号： G10L21/02 ; G10L25/30 ; G10L15/06 ; G10L15/22

摘要：

本发明公开了一种面向语音识别的语音增强方法，包括：步骤1，利用近端麦克风和远端麦克风录制得到的语音，对干净语音进行估计；步骤2，将步骤1中得到的估计语音作为参考语音信号，计算参考语音和待测降噪语音的包络相关系数，构造和语音识别相关的模型优化目标函数；步骤3，构建语音增强的深度神经网络模型，训练目标为估计语音，模型优化目标函数由步骤2得到；根据优化结果实现语音增强。本发明方法利用估计语音提高语音识别性能，并保证了人耳听觉感知质量，更适用于面向语音识别的语音增强。

公开/授权文献

CN110970044A 一种面向语音识别的语音增强方法公开/授权日：2020-04-07

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L21/00	为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L19/00优先）
G10L21/02	.语音增强，例如降低噪声或消除回声（在直线传送系统中减轻回声效应入H04B3/20；免提电话中的回声抑制入H04M9/08）