Patent search ap:("中国科学院声学研究所") AND inv:"黄兆琼" Page 1

1.

发明公开
一种基于时间延迟直方图的语音分离方法有权

公开(公告)号：CN108269583A

公开(公告)日：2018-07-10

申请号：CN201710001937.4

申请日：2017-01-03

Applicant: 中国科学院声学研究所

Inventor： 应冬文 , 黄兆琼 , 潘接林 , 颜永红

IPC: G10L21/0272 , G10L21/0308 , G10L25/03

Abstract: 本发明涉及一种基于时间延迟直方图的语音分离方法，包括：将声源信号转换成数字声音信号；提取数字声音信号的频谱；利用声源信号中所有时频点上的时间延迟来构建时间延迟直方图，抽取显著峰值作为时间延迟的估计值；利用时间延迟的估计值来计算每个语音源的波达方向估计值；利用每个语音源的波达方向估计值对混合语音的频谱进行分类，得到每个语音源的掩摸，进而根据该掩摸以及数字声音信号的频谱计算频域上的分离信号；在每个掩摸上对频域的分离信号进行傅里叶逆变换，得到分离的语音。

2.

发明公开
一种水下声源定位方法有权转让

公开(公告)号：CN109975762A

公开(公告)日：2019-07-05

申请号：CN201711454053.0

申请日：2017-12-28

Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司

Inventor： 徐及 , 黄兆琼 , 颜永红

IPC: G01S5/20 , G06N3/08

Abstract: 本发明涉及一种水下声源定位方法，包括以下步骤：将通过水听器阵列接收的声源信号转换成数字声音信号；对所述数字声音信号进行做傅里叶变换；在信号带宽内每个频率上计算数据协方差矩阵，然后通过特征值分解提取能表征信号方位信息的特征向量；在训练阶段，利用时延神经网络学习训练样本，得到特征向量和声源方位的映射关系模型；在测试阶段，输入测试样本的特征向量到训练好的模型，得到声源的距离和深度估计值。本发明利用深度神经网络，实现鲁棒而高效的水下声源定位。

3.

发明公开
一种用于麦克风阵列的解析式空间解混叠方法有权

公开(公告)号：CN108398664A

公开(公告)日：2018-08-14

申请号：CN201710068121.3

申请日：2017-02-07

Applicant: 中国科学院声学研究所

Inventor： 应冬文 , 战鸽 , 黄兆琼 , 潘接林 , 颜永红

IPC: G01S5/18

Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法，包括：麦克风阵列接收声源信号，所述声源信号转换成数字声音信号；提取所述数字声音信号的频谱，得到麦克风阵列中每个麦克风的数字声音信号的频谱；根据每个麦克风的数字声音信号的频谱，估计每一个频点上的空间相关矩阵；对每一个频点上的空间相关矩阵进行分解，得到主特征向量，所述主特征向量的每个分量对应一个麦克风的采集信号；根据每个频点上的主特征向量，求取任意两个麦克风间的时间相位差；根据麦克风之间的时间相位差，通过解混叠公式求取周期数组合，进而从中找出最优的周期值。

4.

发明公开
一种基于相位差回归的单声源定位方法有权

公开(公告)号：CN106405501A

公开(公告)日：2017-02-15

申请号：CN201510456996.1

申请日：2015-07-29

Applicant: 中国科学院声学研究所

Inventor： 应冬文 , 黄兆琼 , 战鸽 , 颜永红

IPC: G01S5/22

CPC classification number: G01S5/22

Abstract: 本发明涉及一种基于相位差回归的单声源定位方法，包括：将通过麦克风阵列接收的声源信号转换成数字声音信号；对所述数字声音信号进行预处理，然后提取麦克风阵列中每个麦克风的数字声音信号的频谱；利用相邻时间相同频点上所有麦克风的数字声音信号的频谱计算t时刻每个频点的空间相关矩阵；对t时刻每个频点上的空间相关矩阵进行分解，得到t时刻每个频点上的主特征向量；利用t时刻每个频点上的主特征向量求取t时刻每个频点上M对麦克风的相位差集合；采用迭代的方法，对相位差进行回归得到t时刻声源的入射方向角。

5.

发明授权
一种基于深度学习的多声源测向方法及系统有权

公开(公告)号：CN112257484B

公开(公告)日：2024-03-15

申请号：CN201910661146.3

申请日：2019-07-22

Applicant: 中国科学院声学研究所

Inventor： 徐及 , 黄兆琼 , 颜永红

IPC: G06F18/213 , G06N3/0464 , G06N3/08 , G06F17/14

Abstract: 本发明涉及一种基于深度学习的多声源测向方法及系统，所述方法包括：将阵列接收的声源信号转换成数字声音信号；对所述数字声音信号进行做傅里叶变换，得到傅里叶变换后的信号；将傅里叶变换后的信号输入深度神经网络，使用反向传播方法训练深度神经网络，直至深度神经网络收敛；从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位，该方位为声源出现的方位。本发明的方法利用了深度神经网络，通过优化准则函数，寻找声源波达方向的最优解，该方法直接从阵列接受的信号得到目标的方位，实现了简单而高效的多声源测向。

6.

发明授权
一种基于时间延迟直方图的语音分离方法有权

公开(公告)号：CN108269583B

公开(公告)日：2021-07-30

申请号：CN201710001937.4

申请日：2017-01-03

Applicant: 中国科学院声学研究所

Inventor： 应冬文 , 黄兆琼 , 潘接林 , 颜永红

IPC: G10L21/0272 , G10L21/0308 , G10L25/03

Abstract: 本发明涉及一种基于时间延迟直方图的语音分离方法，包括：将声源信号转换成数字声音信号；提取数字声音信号的频谱；利用声源信号中所有时频点上的时间延迟来构建时间延迟直方图，抽取显著峰值作为时间延迟的估计值；利用时间延迟的估计值来计算每个语音源的波达方向估计值；利用每个语音源的波达方向估计值对混合语音的频谱进行分类，得到每个语音源的掩摸，进而根据该掩摸以及数字声音信号的频谱计算频域上的分离信号；在每个掩摸上对频域的分离信号进行傅里叶逆变换，得到分离的语音。

7.

发明授权
一种水下声源定位方法有权转让

公开(公告)号：CN109975762B

公开(公告)日：2021-05-18

申请号：CN201711454053.0

申请日：2017-12-28

Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司

Inventor： 徐及 , 黄兆琼 , 颜永红

IPC: G01S5/20 , G06N3/08

Abstract: 本发明涉及一种水下声源定位方法，包括以下步骤：将通过水听器阵列接收的声源信号转换成数字声音信号；对所述数字声音信号进行做傅里叶变换；在信号带宽内每个频率上计算数据协方差矩阵，然后通过特征值分解提取能表征信号方位信息的特征向量；在训练阶段，利用时延神经网络学习训练样本，得到特征向量和声源方位的映射关系模型；在测试阶段，输入测试样本的特征向量到训练好的模型，得到声源的距离和深度估计值。本发明利用深度神经网络，实现鲁棒而高效的水下声源定位。

8.

发明授权
一种用于麦克风阵列的解析式空间解混叠方法有权

公开(公告)号：CN108398664B

公开(公告)日：2020-09-08

申请号：CN201710068121.3

申请日：2017-02-07

Applicant: 中国科学院声学研究所

Inventor： 应冬文 , 战鸽 , 黄兆琼 , 潘接林 , 颜永红

IPC: G01S5/18

Abstract: 本发明涉及一种用于麦克风阵列的解析式空间解混叠方法，包括：麦克风阵列接收声源信号，所述声源信号转换成数字声音信号；提取所述数字声音信号的频谱，得到麦克风阵列中每个麦克风的数字声音信号的频谱；根据每个麦克风的数字声音信号的频谱，估计每一个频点上的空间相关矩阵；对每一个频点上的空间相关矩阵进行分解，得到主特征向量，所述主特征向量的每个分量对应一个麦克风的采集信号；根据每个频点上的主特征向量，求取任意两个麦克风间的时间相位差；根据麦克风之间的时间相位差，通过解混叠公式求取周期数组合，进而从中找出最优的周期值。

9.

发明授权
一种基于深度学习的水下多声源定位方法及系统有权

公开(公告)号：CN111352075B

公开(公告)日：2022-01-25

申请号：CN201811564007.0

申请日：2018-12-20

Applicant: 中国科学院声学研究所

Inventor： 徐及 , 黄兆琼 , 颜永红

IPC: G01S5/22

Abstract: 本发明公开了一种基于深度学习的水下多声源定位方法及系统，所述方法包括：通过水听器阵列接收待检测的信号，估计声源的方位；在可能存在声源的方位上做子阵波束形成，然后计算待检测信号的空间相关矩阵，形成特征向量，输入到预先训练的时延神经网络，输出声源的距离。本发明的水下多声源定位方法，可以不依赖环境参数的先验知识；利用子阵波束形成的方法在特征层面将多个声源区分开，从而实现对水下多个目标同时定位。

10.

发明公开
一种基于深度学习的多声源测向方法及系统有权

公开(公告)号：CN112257484A

公开(公告)日：2021-01-22

申请号：CN201910661146.3

申请日：2019-07-22

Applicant: 中国科学院声学研究所

Inventor： 徐及 , 黄兆琼 , 颜永红

IPC: G06K9/00 , G06N3/04 , G06N3/08 , G06F17/14

Abstract: 本发明涉及一种基于深度学习的多声源测向方法及系统，所述方法包括：将阵列接收的声源信号转换成数字声音信号；对所述数字声音信号进行做傅里叶变换，得到傅里叶变换后的信号；将傅里叶变换后的信号输入深度神经网络，使用反向传播方法训练深度神经网络，直至深度神经网络收敛；从收敛后的深度神经网络输出的后验概率中找到峰值对应的方位，该方位为声源出现的方位。本发明的方法利用了深度神经网络，通过优化准则函数，寻找声源波达方向的最优解，该方法直接从阵列接受的信号得到目标的方位，实现了简单而高效的多声源测向。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification