发明授权
- 专利标题: 一种面向语音识别的语音增强方法
-
申请号: CN201911180882.3申请日: 2019-11-27
-
公开(公告)号: CN110970044B公开(公告)日: 2022-06-07
- 发明人: 杨玉红 , 冯佳倩 , 蔡林君 , 涂卫平 , 艾浩军 , 高戈
- 申请人: 武汉大学
- 申请人地址: 湖北省武汉市武昌区珞珈山武汉大学
- 专利权人: 武汉大学
- 当前专利权人: 武汉大学
- 当前专利权人地址: 湖北省武汉市武昌区珞珈山武汉大学
- 代理机构: 武汉科皓知识产权代理事务所
- 代理商 严彦
- 主分类号: G10L21/02
- IPC分类号: G10L21/02 ; G10L25/30 ; G10L15/06 ; G10L15/22
摘要:
本发明公开了一种面向语音识别的语音增强方法,包括:步骤1,利用近端麦克风和远端麦克风录制得到的语音,对干净语音进行估计;步骤2,将步骤1中得到的估计语音作为参考语音信号,计算参考语音和待测降噪语音的包络相关系数,构造和语音识别相关的模型优化目标函数;步骤3,构建语音增强的深度神经网络模型,训练目标为估计语音,模型优化目标函数由步骤2得到;根据优化结果实现语音增强。本发明方法利用估计语音提高语音识别性能,并保证了人耳听觉感知质量,更适用于面向语音识别的语音增强。
公开/授权文献
- CN110970044A 一种面向语音识别的语音增强方法 公开/授权日:2020-04-07