-
公开(公告)号:CN112309421B
公开(公告)日:2024-03-19
申请号:CN201910689178.4
申请日:2019-07-29
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L21/0224 , G10L21/0232 , G10L25/30 , G10L25/45 , G10L25/60
Abstract: 本发明属于语音增强信号处理技术领域,具体涉及一种融合信噪比与可懂度双重目标的语音增强方法,包括:将原始语音信号转换为原始时频域特征;将原始时频域特征输入预建立的第一神经网络模型中,获取具有信噪比的第一有效特征;将原始时频域特征输入预建立的第二神经网络模型中,获取具有可懂度的第二有效特征;对第一有效特征和第二有效特征进行处理得到权重矩阵,根据预设的相关性权重阈值,从权重矩阵中逐列选取第二有效特征中与第一有效特征相关性高的元素,提取该元素的相关性权重阈值,并用其替换第一有效特征中对应位置上的阈值,将替换后的第一有效特征作为语音增强后的时频域特征,将语音增强后的时频域特征转换为增强后的语音信号。
-
公开(公告)号:CN110070887B
公开(公告)日:2021-04-09
申请号:CN201810065070.3
申请日:2018-01-23
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种语音特征重建方法及装置,该方法包括:基于二值掩蔽算法从待处理的原始语音信号中分离出第一有效语音信号;将第一有效语音信号转换为第一时频域特征;根据第一时频域特征以及预设长度的滑动窗,对预设的第一掩模矩阵进行处理,获取处理后的第一掩模矩阵;将处理后的第一掩模矩阵与第一时频域特征进行拼接,构成第一复合特征;将第一复合特征输入至预建立的最优深度神经网络模型中,重建与原始语音信号对应的所有语音特征。上述方式,可以实现语音信号缺失特征重建,尤其是恢复了被噪音遮蔽的语音成分,提升语音信号质量。
-
公开(公告)号:CN112309421A
公开(公告)日:2021-02-02
申请号:CN201910689178.4
申请日:2019-07-29
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G10L21/0224 , G10L21/0232 , G10L25/30 , G10L25/45 , G10L25/60
Abstract: 本发明属于语音增强信号处理技术领域,具体涉及一种融合信噪比与可懂度双重目标的语音增强方法,包括:将原始语音信号转换为原始时频域特征;将原始时频域特征输入预建立的第一神经网络模型中,获取具有信噪比的第一有效特征;将原始时频域特征输入预建立的第二神经网络模型中,获取具有可懂度的第二有效特征;对第一有效特征和第二有效特征进行处理得到权重矩阵,根据预设的相关性权重阈值,从权重矩阵中逐列选取第二有效特征中与第一有效特征相关性高的元素,提取该元素的相关性权重阈值,并用其替换第一有效特征中对应位置上的阈值,将替换后的第一有效特征作为语音增强后的时频域特征,将语音增强后的时频域特征转换为增强后的语音信号。
-
公开(公告)号:CN110070887A
公开(公告)日:2019-07-30
申请号:CN201810065070.3
申请日:2018-01-23
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种语音特征重建方法及装置,该方法包括:基于二值掩蔽算法从待处理的原始语音信号中分离出第一有效语音信号;将第一有效语音信号转换为第一时频域特征;根据第一时频域特征以及预设长度的滑动窗,对预设的第一掩模矩阵进行处理,获取处理后的第一掩模矩阵;将处理后的第一掩模矩阵与第一时频域特征进行拼接,构成第一复合特征;将第一复合特征输入至预建立的最优深度神经网络模型中,重建与原始语音信号对应的所有语音特征。上述方式,可以实现语音信号缺失特征重建,尤其是恢复了被噪音遮蔽的语音成分,提升语音信号质量。
-
公开(公告)号:CN108398664A
公开(公告)日:2018-08-14
申请号:CN201710068121.3
申请日:2017-02-07
Applicant: 中国科学院声学研究所
IPC: G01S5/18
Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法,包括:麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;根据每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;对每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。
-
公开(公告)号:CN106405501A
公开(公告)日:2017-02-15
申请号:CN201510456996.1
申请日:2015-07-29
Applicant: 中国科学院声学研究所
IPC: G01S5/22
CPC classification number: G01S5/22
Abstract: 本发明涉及一种基于相位差回归的单声源定位方法,包括:将通过麦克风阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行预处理,然后提取麦克风阵列中每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算t时刻每个频点的空间相关矩阵;对t时刻每个频点上的空间相关矩阵进行分解,得到t时刻每个频点上的主特征向量;利用t时刻每个频点上的主特征向量求取t时刻每个频点上M对麦克风的相位差集合;采用迭代的方法,对相位差进行回归得到t时刻声源的入射方向角。
-
公开(公告)号:CN108398664B
公开(公告)日:2020-09-08
申请号:CN201710068121.3
申请日:2017-02-07
Applicant: 中国科学院声学研究所
IPC: G01S5/18
Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法,包括:麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;根据每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;对每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。
-
公开(公告)号:CN106405501B
公开(公告)日:2019-05-17
申请号:CN201510456996.1
申请日:2015-07-29
Applicant: 中国科学院声学研究所
IPC: G01S5/22
Abstract: 本发明涉及一种基于相位差回归的单声源定位方法,包括:将通过麦克风阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行预处理,然后提取麦克风阵列中每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算t时刻每个频点的空间相关矩阵;对t时刻每个频点上的空间相关矩阵进行分解,得到t时刻每个频点上的主特征向量;利用t时刻每个频点上的主特征向量求取t时刻每个频点上M对麦克风的相位差集合;采用迭代的方法,对相位差进行回归得到t时刻声源的入射方向角。
-
-
-
-
-
-
-