一种基于时间延迟直方图的语音分离方法

    公开(公告)号:CN108269583A

    公开(公告)日:2018-07-10

    申请号:CN201710001937.4

    申请日:2017-01-03

    Abstract: 本发明涉及一种基于时间延迟直方图的语音分离方法,包括:将声源信号转换成数字声音信号;提取数字声音信号的频谱;利用声源信号中所有时频点上的时间延迟来构建时间延迟直方图,抽取显著峰值作为时间延迟的估计值;利用时间延迟的估计值来计算每个语音源的波达方向估计值;利用每个语音源的波达方向估计值对混合语音的频谱进行分类,得到每个语音源的掩摸,进而根据该掩摸以及数字声音信号的频谱计算频域上的分离信号;在每个掩摸上对频域的分离信号进行傅里叶逆变换,得到分离的语音。

    一种水下声源定位方法

    公开(公告)号:CN109975762A

    公开(公告)日:2019-07-05

    申请号:CN201711454053.0

    申请日:2017-12-28

    Abstract: 本发明涉及一种水下声源定位方法,包括以下步骤:将通过水听器阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换;在信号带宽内每个频率上计算数据协方差矩阵,然后通过特征值分解提取能表征信号方位信息的特征向量;在训练阶段,利用时延神经网络学习训练样本,得到特征向量和声源方位的映射关系模型;在测试阶段,输入测试样本的特征向量到训练好的模型,得到声源的距离和深度估计值。本发明利用深度神经网络,实现鲁棒而高效的水下声源定位。

    一种用于麦克风阵列的解析式空间解混叠方法

    公开(公告)号:CN108398664A

    公开(公告)日:2018-08-14

    申请号:CN201710068121.3

    申请日:2017-02-07

    Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法,包括:麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;根据每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;对每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。

    一种基于相位差回归的单声源定位方法

    公开(公告)号:CN106405501A

    公开(公告)日:2017-02-15

    申请号:CN201510456996.1

    申请日:2015-07-29

    CPC classification number: G01S5/22

    Abstract: 本发明涉及一种基于相位差回归的单声源定位方法,包括:将通过麦克风阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行预处理,然后提取麦克风阵列中每个麦克风的数字声音信号的频谱;利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算t时刻每个频点的空间相关矩阵;对t时刻每个频点上的空间相关矩阵进行分解,得到t时刻每个频点上的主特征向量;利用t时刻每个频点上的主特征向量求取t时刻每个频点上M对麦克风的相位差集合;采用迭代的方法,对相位差进行回归得到t时刻声源的入射方向角。

    一种基于深度学习的多声源测向方法及系统

    公开(公告)号:CN112257484B

    公开(公告)日:2024-03-15

    申请号:CN201910661146.3

    申请日:2019-07-22

    Abstract: 本发明涉及一种基于深度学习的多声源测向方法及系统,所述方法包括:将阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换,得到傅里叶变换后的信号;将傅里叶变换后的信号输入深度神经网络,使用反向传播方法训练深度神经网络,直至深度神经网络收敛;从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位,该方位为声源出现的方位。本发明的方法利用了深度神经网络,通过优化准则函数,寻找声源波达方向的最优解,该方法直接从阵列接受的信号得到目标的方位,实现了简单而高效的多声源测向。

    一种基于时间延迟直方图的语音分离方法

    公开(公告)号:CN108269583B

    公开(公告)日:2021-07-30

    申请号:CN201710001937.4

    申请日:2017-01-03

    Abstract: 本发明涉及一种基于时间延迟直方图的语音分离方法,包括:将声源信号转换成数字声音信号;提取数字声音信号的频谱;利用声源信号中所有时频点上的时间延迟来构建时间延迟直方图,抽取显著峰值作为时间延迟的估计值;利用时间延迟的估计值来计算每个语音源的波达方向估计值;利用每个语音源的波达方向估计值对混合语音的频谱进行分类,得到每个语音源的掩摸,进而根据该掩摸以及数字声音信号的频谱计算频域上的分离信号;在每个掩摸上对频域的分离信号进行傅里叶逆变换,得到分离的语音。

    一种水下声源定位方法

    公开(公告)号:CN109975762B

    公开(公告)日:2021-05-18

    申请号:CN201711454053.0

    申请日:2017-12-28

    Abstract: 本发明涉及一种水下声源定位方法,包括以下步骤:将通过水听器阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换;在信号带宽内每个频率上计算数据协方差矩阵,然后通过特征值分解提取能表征信号方位信息的特征向量;在训练阶段,利用时延神经网络学习训练样本,得到特征向量和声源方位的映射关系模型;在测试阶段,输入测试样本的特征向量到训练好的模型,得到声源的距离和深度估计值。本发明利用深度神经网络,实现鲁棒而高效的水下声源定位。

    一种用于麦克风阵列的解析式空间解混叠方法

    公开(公告)号:CN108398664B

    公开(公告)日:2020-09-08

    申请号:CN201710068121.3

    申请日:2017-02-07

    Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法,包括:麦克风阵列接收声源信号,所述声源信号转换成数字声音信号;提取所述数字声音信号的频谱,得到麦克风阵列中每个麦克风的数字声音信号的频谱;根据每个麦克风的数字声音信号的频谱,估计每一个频点上的空间相关矩阵;对每一个频点上的空间相关矩阵进行分解,得到主特征向量,所述主特征向量的每个分量对应一个麦克风的采集信号;根据每个频点上的主特征向量,求取任意两个麦克风间的时间相位差;根据麦克风之间的时间相位差,通过解混叠公式求取周期数组合,进而从中找出最优的周期值。

    一种基于深度学习的水下多声源定位方法及系统

    公开(公告)号:CN111352075B

    公开(公告)日:2022-01-25

    申请号:CN201811564007.0

    申请日:2018-12-20

    Abstract: 本发明公开了一种基于深度学习的水下多声源定位方法及系统,所述方法包括:通过水听器阵列接收待检测的信号,估计声源的方位;在可能存在声源的方位上做子阵波束形成,然后计算待检测信号的空间相关矩阵,形成特征向量,输入到预先训练的时延神经网络,输出声源的距离。本发明的水下多声源定位方法,可以不依赖环境参数的先验知识;利用子阵波束形成的方法在特征层面将多个声源区分开,从而实现对水下多个目标同时定位。

    一种基于深度学习的多声源测向方法及系统

    公开(公告)号:CN112257484A

    公开(公告)日:2021-01-22

    申请号:CN201910661146.3

    申请日:2019-07-22

    Abstract: 本发明涉及一种基于深度学习的多声源测向方法及系统,所述方法包括:将阵列接收的声源信号转换成数字声音信号;对所述数字声音信号进行做傅里叶变换,得到傅里叶变换后的信号;将傅里叶变换后的信号输入深度神经网络,使用反向传播方法训练深度神经网络,直至深度神经网络收敛;从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位,该方位为声源出现的方位。本发明的方法利用了深度神经网络,通过优化准则函数,寻找声源波达方向的最优解,该方法直接从阵列接受的信号得到目标的方位,实现了简单而高效的多声源测向。

Patent Agency Ranking