发明公开
- 专利标题: 柔性麦克风阵列语音增强方法及装置、电子设备、介质
-
申请号: CN202310349782.9申请日: 2023-03-28
-
公开(公告)号: CN116343808A公开(公告)日: 2023-06-27
- 发明人: 王若凡 , 施钧辉 , 王钰琪 , 张劲 , 阮永都
- 申请人: 之江实验室
- 申请人地址: 浙江省杭州市余杭区中泰街道之江实验室南湖总部
- 专利权人: 之江实验室
- 当前专利权人: 之江实验室
- 当前专利权人地址: 浙江省杭州市余杭区中泰街道之江实验室南湖总部
- 代理机构: 杭州求是专利事务所有限公司
- 代理商 邱启旺
- 主分类号: G10L21/02
- IPC分类号: G10L21/02 ; G10L21/0216 ; G10L25/78
摘要:
本发明公开了一种柔性麦克风阵列语音增强方法及装置、电子设备、介质,包括:获取语音门限值;对麦克风阵列接收到的信号划分为若干子带,计算所有子带的二元高斯对数似然比之和,并基于语音门限值进行语音存在性检测;对麦克风阵列接收到的信号的协方差矩阵求谱函数,进行谱峰搜索,找到谱函数的极大值,极大值对应的角度即声源方向角;对声源方向的信号进行波束响应优化以增强声源方向语音信号,再经维纳滤波处理后输出增强的语音信号。本发明方法能够实现在嘈杂环境下多人会话场景下的实时语音信号分离与增强。