-
公开(公告)号:CN113744751B
公开(公告)日:2024-05-17
申请号:CN202110935773.9
申请日:2021-08-16
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
IPC: G10L21/0216 , G10L25/30
Abstract: 本发明公开了一种应用于麦克风阵列的多通道语音信号增强方法,包括以下步骤:生成训练数据;对所述训练数据进行预处理;对预处理结果进行通道间特征提取;设计多通道滤波器;利用所述各个通道的滤波器对对应通道的第一分帧语音数据或第二分帧语音数据或带噪语音数据进行滤波操作,得到经过滤波后的增强语音信号;对各个通道的增强语音信号进行加权求和、取平均操作,以得到目标输出语音。本发明提供的多通道语音信号增强方法充分考虑降噪空间的空间特性,采用创新方法提取多通道间特征,并设计双阶段Bi‑LSTM作为多通道滤波器,使得声场传输特性表达更准确。
-
公开(公告)号:CN113744751A
公开(公告)日:2021-12-03
申请号:CN202110935773.9
申请日:2021-08-16
Applicant: 清华大学苏州汽车研究院(相城) , 华研慧声(苏州)电子科技有限公司
IPC: G10L21/0216 , G10L25/30
Abstract: 本发明公开了一种应用于麦克风阵列的多通道语音信号增强方法,包括以下步骤:生成训练数据;对所述训练数据进行预处理;对预处理结果进行通道间特征提取;设计多通道滤波器;利用所述各个通道的滤波器对对应通道的第一分帧语音数据或第二分帧语音数据或带噪语音数据进行滤波操作,得到经过滤波后的增强语音信号;对各个通道的增强语音信号进行加权求和、取平均操作,以得到目标输出语音。本发明提供的多通道语音信号增强方法充分考虑降噪空间的空间特性,采用创新方法提取多通道间特征,并设计双阶段Bi‑LSTM作为多通道滤波器,使得声场传输特性表达更准确。
-
公开(公告)号:CN114954320B
公开(公告)日:2025-02-25
申请号:CN202210453168.2
申请日:2022-04-27
Applicant: 清华大学苏州汽车研究院(相城)
IPC: B60R16/037 , B60R16/023 , G10L15/22
Abstract: 本发明公开了一种车载传声器的功能复用方法,包括以下步骤:将路噪主动控制系统采集的声音信号输出至触发模块;若所述触发模块在所述声音信号中检测出唤醒指令信号,则将所述声音信号输出至车载智能语音系统,并执行下一步,若持续一段时间内未检测出语音信号,停止将所述声音信号输出至车载智能语音系统;对所述声音信号进行降采样率处理以适配所述车载智能语音系统的语音识别模块。本发明提供的车载传声器的功能复用方法将车载路噪主动控制系统的传声器与车载智能语音系统传声器进行拾音功能的复用,减少车载传声器数量,降低汽车的成本。
-
公开(公告)号:CN114954320A
公开(公告)日:2022-08-30
申请号:CN202210453168.2
申请日:2022-04-27
Applicant: 清华大学苏州汽车研究院(相城)
IPC: B60R16/037 , B60R16/023 , G10L15/22
Abstract: 本发明公开了一种车载传声器的功能复用方法,包括以下步骤:将路噪主动控制系统采集的声音信号输出至触发模块;若所述触发模块在所述声音信号中检测出唤醒指令信号,则将所述声音信号输出至车载智能语音系统,并执行下一步,若持续一段时间内未检测出语音信号,停止将所述声音信号输出至车载智能语音系统;对所述声音信号进行降采样率处理以适配所述车载智能语音系统的语音识别模块。本发明提供的车载传声器的功能复用方法将车载路噪主动控制系统的传声器与车载智能语音系统传声器进行拾音功能的复用,减少车载传声器数量,降低汽车的成本。
-
公开(公告)号:CN115050367B
公开(公告)日:2022-11-04
申请号:CN202210964641.3
申请日:2022-08-12
Applicant: 清华大学苏州汽车研究院(相城)
Abstract: 本发明公开了一种说话目标定位方法、装置、设备及存储介质。该方法包括:若检测到定位触发事件,则根据目标语音数据,确定目标语音特征;对所述目标语音特征进行特征提取,得到特征序列集合;根据所述特征序列集合,确定最大特征集合和平均特征集合;根据最大特征集合和平均特征集合,确定说话目标位置。本技术方案解决了基于信号处理的定位算法对传声器部署位置要求高、噪声干扰对定位精度影响大等问题,可以在提高定位准确性的同时,减少对传声器等硬件设备部署的位置约束,进而达到良好的抗干扰性。
-
公开(公告)号:CN115050367A
公开(公告)日:2022-09-13
申请号:CN202210964641.3
申请日:2022-08-12
Applicant: 清华大学苏州汽车研究院(相城)
Abstract: 本发明公开了一种说话目标定位方法、装置、设备及存储介质。该方法包括:若检测到定位触发事件,则根据目标语音数据,确定目标语音特征;对所述目标语音特征进行特征提取,得到特征序列集合;根据所述特征序列集合,确定最大特征集合和平均特征集合;根据最大特征集合和平均特征集合,确定说话目标位置。本技术方案解决了基于信号处理的定位算法对传声器部署位置要求高、噪声干扰对定位精度影响大等问题,可以在提高定位准确性的同时,减少对传声器等硬件设备部署的位置约束,进而达到良好的抗干扰性。
-
-
-
-
-