-
公开(公告)号:CN108269583A
公开(公告)日:2018-07-10
申请号:CN201710001937.4
申请日:2017-01-03
Applicant: 中国科学院声学研究所
IPC: G10L21/0272 , G10L21/0308 , G10L25/03
Abstract: 本发明涉及一种基于时间延迟直方图的语音分离方法,包括:将声源信号转换成数字声音信号;提取数字声音信号的频谱;利用声源信号中所有时频点上的时间延迟来构建时间延迟直方图,抽取显著峰值作为时间延迟的估计值;利用时间延迟的估计值来计算每个语音源的波达方向估计值;利用每个语音源的波达方向估计值对混合语音的频谱进行分类,得到每个语音源的掩摸,进而根据该掩摸以及数字声音信号的频谱计算频域上的分离信号;在每个掩摸上对频域的分离信号进行傅里叶逆变换,得到分离的语音。
-
公开(公告)号:CN109975762A
公开(公告)日:2019-07-05
申请号:CN201711454053.0
申请日:2017-12-28
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种水下声源定位方法,包括以下步骤:将通过水听器阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换;在信号带宽内每个频率上计算数据协方差矩阵,然后通过特征值分解提取能表征信号方位信息的特征向量;在训练阶段,利用时延神经网络学习训练样本,得到特征向量和声源方位的映射关系模型;在测试阶段,输入测试样本的特征向量到训练好的模型,得到声源的距离和深度估计值。本发明利用深度神经网络,实现鲁棒而高效的水下声源定位。
-
公开(公告)号:CN108398664A
公开(公告)日:2018-08-14
申请号:CN201710068121.3
申请日:2017-02-07
Applicant: 中国科学院声学研究所
IPC: G01S5/18
Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法,包括:麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;根据每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;对每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。
-
公开(公告)号:CN106405501A
公开(公告)日:2017-02-15
申请号:CN201510456996.1
申请日:2015-07-29
Applicant: 中国科学院声学研究所
IPC: G01S5/22
CPC classification number: G01S5/22
Abstract: 本发明涉及一种基于相位差回归的单声源定位方法,包括:将通过麦克风阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行预处理,然后提取麦克风阵列中每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算t时刻每个频点的空间相关矩阵;对t时刻每个频点上的空间相关矩阵进行分解,得到t时刻每个频点上的主特征向量;利用t时刻每个频点上的主特征向量求取t时刻每个频点上M对麦克风的相位差集合;采用迭代的方法,对相位差进行回归得到t时刻声源的入射方向角。
-
公开(公告)号:CN112257484B
公开(公告)日:2024-03-15
申请号:CN201910661146.3
申请日:2019-07-22
Applicant: 中国科学院声学研究所
IPC: G06F18/213 , G06N3/0464 , G06N3/08 , G06F17/14
Abstract: 本发明涉及一种基于深度学习的多声源测向方法及系统,所述方法包括:将阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换,得到傅里叶变换后的信号;将傅里叶变换后的信号输入深度神经网络,使用反向传播方法训练深度神经网络,直至深度神经网络收敛;从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位,该方位为声源出现的方位。本发明的方法利用了深度神经网络,通过优化准则函数,寻找声源波达方向的最优解,该方法直接从阵列接受的信号得到目标的方位,实现了简单而高效的多声源测向。
-
公开(公告)号:CN108269583B
公开(公告)日:2021-07-30
申请号:CN201710001937.4
申请日:2017-01-03
Applicant: 中国科学院声学研究所
IPC: G10L21/0272 , G10L21/0308 , G10L25/03
Abstract: 本发明涉及一种基于时间延迟直方图的语音分离方法,包括:将声源信号转换成数字声音信号;提取数字声音信号的频谱;利用声源信号中所有时频点上的时间延迟来构建时间延迟直方图,抽取显著峰值作为时间延迟的估计值;利用时间延迟的估计值来计算每个语音源的波达方向估计值;利用每个语音源的波达方向估计值对混合语音的频谱进行分类,得到每个语音源的掩摸,进而根据该掩摸以及数字声音信号的频谱计算频域上的分离信号;在每个掩摸上对频域的分离信号进行傅里叶逆变换,得到分离的语音。
-
公开(公告)号:CN109975762B
公开(公告)日:2021-05-18
申请号:CN201711454053.0
申请日:2017-12-28
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明涉及一种水下声源定位方法,包括以下步骤:将通过水听器阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换;在信号带宽内每个频率上计算数据协方差矩阵,然后通过特征值分解提取能表征信号方位信息的特征向量;在训练阶段,利用时延神经网络学习训练样本,得到特征向量和声源方位的映射关系模型;在测试阶段,输入测试样本的特征向量到训练好的模型,得到声源的距离和深度估计值。本发明利用深度神经网络,实现鲁棒而高效的水下声源定位。
-
公开(公告)号:CN108398664B
公开(公告)日:2020-09-08
申请号:CN201710068121.3
申请日:2017-02-07
Applicant: 中国科学院声学研究所
IPC: G01S5/18
Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法,包括:麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;根据每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;对每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。
-
公开(公告)号:CN111352075B
公开(公告)日:2022-01-25
申请号:CN201811564007.0
申请日:2018-12-20
Applicant: 中国科学院声学研究所
IPC: G01S5/22
Abstract: 本发明公开了一种基于深度学习的水下多声源定位方法及系统,所述方法包括:通过水听器阵列接收待检测的信号,估计声源的方位;在可能存在声源的方位上做子阵波束形成,然后计算待检测信号的空间相关矩阵,形成特征向量,输入到预先训练的时延神经网络,输出声源的距离。本发明的水下多声源定位方法,可以不依赖环境参数的先验知识;利用子阵波束形成的方法在特征层面将多个声源区分开,从而实现对水下多个目标同时定位。
-
公开(公告)号:CN112257484A
公开(公告)日:2021-01-22
申请号:CN201910661146.3
申请日:2019-07-22
Applicant: 中国科学院声学研究所
Abstract: 本发明涉及一种基于深度学习的多声源测向方法及系统,所述方法包括:将阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换,得到傅里叶变换后的信号;将傅里叶变换后的信号输入深度神经网络,使用反向传播方法训练深度神经网络,直至深度神经网络收敛;从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位,该方位为声源出现的方位。本发明的方法利用了深度神经网络,通过优化准则函数,寻找声源波达方向的最优解,该方法直接从阵列接受的信号得到目标的方位,实现了简单而高效的多声源测向。
-
-
-
-
-
-
-
-
-