Patent search ap:("中国科学院声学研究所") AND inv:"付强" Page 1

1.

发明公开
一种基于音频的公路车道动态定位方法有权

公开(公告)号：CN105989709A

公开(公告)日：2016-10-05

申请号：CN201510072795.1

申请日：2015-02-11

Applicant: 中国科学院声学研究所

Inventor： 纳跃跃 , 付强 , 国雁萌 , 颜永红

IPC: G08G1/01

Abstract: 本发明提供了一种基于音频的公路车道动态定位方法，所述方法包括：步骤1)传声器阵列的各个阵元采集车辆噪声信号；步骤2)对车辆噪声信号进行处理，得到相关矩阵C；步骤3)构造车道检测断面，并根据相关矩阵C计算车道检测断面上的能量谱；步骤4)计算前景阈值α和背景阈值β；步骤5)根据前景阈值α和背景阈值β，对车道检测断面的能量谱进行归一化处理，并判断车辆是否进出车道检测断面；步骤6)统计进入车道检测断面的车辆的方位角，计算车道位置及宽度。本发明的基于音频的公路车道动态定位方法，具有更高的分辨率，在相同的条件下可以定位出更多的车道；而且算法整体的计算量更小，对硬件的要求更低。

2.

发明授权
一种基于双麦克风的目标方向语音活动检测方法及系统失效

公开(公告)号：CN103248992B

公开(公告)日：2016-01-20

申请号：CN201210027677.5

申请日：2012-02-08

Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司

Inventor： 国雁萌 , 李凯 , 姜开宇 , 付强 , 颜永红

IPC: H04R29/00

Abstract: 本发明涉及一种基于双麦克风的目标方向语音活动检测方法及系统，包含：步骤101)获取两通道每个时频点上的相位差信息；步骤102)输入感兴趣的目标方向区域，计算目标方向区域所对应的相位差范围；步骤103)依据确定的各时频点的相位差信息及目标方向相位差范围，确定步骤101)的各时频点上的信号是否来自于目标方向范围内；步骤104)将第k帧开始的L帧语音信号作一个分析窗，每帧信号有Q个频率点，如果分析窗内的每个频率点分量有不少于μ帧信号在该频率分量上判断属于目标方向，则判断该频率分量上存在目标语音，否则判频率分量上不存在目标语音，如果存在目标语音的频率分量的个数超过阈值ξ，则将该分析窗内的连续L帧信号最终判断为存在目标语音。

3.

发明授权
一种基于耳机的虚拟3D重放方法失效

公开(公告)号：CN102665156B

公开(公告)日：2014-07-02

申请号：CN201210083752.X

申请日：2012-03-27

Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司

Inventor： 李军锋 , 夏日升 , 付强 , 颜永红

IPC: H04R1/20 , H04R1/10

Abstract: 本发明涉及一种基于耳机的虚拟3D重放方法，其包括设定虚拟3D声源的参数；计算空气对声音的吸收值，计算声音的声压衰减因子；计算房间脉冲响应RIR；计算RIR每样点与接收点位置距离d，依据d计算原声源经传输d距离后的声压；以插值法处理墙面频率点的吸收系数，以获得增加空气衰减及墙面吸收后的房间脉冲响应；计算声源点和头位置之间的水平角度和仰角，以选择最接近的头相关传输函数；将HRTF与增加空气衰减及墙面吸收后的房间脉冲响应卷积，以获得双耳房间脉冲响应BRIR；将BRIR与输入声信号卷积，以实现基于耳机的虚拟3D声信号。依照本发明提供的方法可较好地解决耳机重放时的“头内”问题、距离方位感、房间特性等问题，从而实现基于耳机的虚拟3D效果。

4.

发明公开
一种用于平面阵列的远场波达角估计方法及系统失效

公开(公告)号：CN103837858A

公开(公告)日：2014-06-04

申请号：CN201210483581.X

申请日：2012-11-23

Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司

Inventor： 应冬文 , 国雁萌 , 付强 , 潘接林 , 颜永红

IPC: G01S5/20

CPC classification number: G01S5/20 , G01S3/8083

Abstract: 本发明涉及一种用于平面阵列的远场波达角估计方法及系统，所述的方法包含：步骤101）将平面阵列作为麦克风对组成的线性子阵列的几何组合，且每一个线性子阵列决定一个子波达角；步骤102）在假定波达方向x已知的情况下：采用全局波达角来计算各子阵列的期望子波达角θi；通过各子阵列的时间差计算子阵列的估计子波达角步骤103）基于估计子波达角和期望子波达角构造代价函数为：步骤104）将代价函数收敛时的波达角作为最终确定的波达角的值，完成声源定位。所述τi采用如下策略获得：提取麦克风阵列的输出数字信号，对每一帧的数字化声音信号做加窗预处理，傅立叶变换并且在频域白化信号；计算预处理后信号的交叉相关，求取所有麦克风对之间的时间延迟τi。

5.

发明公开
一种用于家庭环境的基于传声器阵列的音频输入系统失效

公开(公告)号：CN102164328A

公开(公告)日：2011-08-24

申请号：CN201010622896.9

申请日：2010-12-29

Applicant: 中国科学院声学研究所

Inventor： 付强 , 国雁萌 , 应东文 , 李凯 , 姜开宇 , 颜永红

IPC: H04R1/40 , H04R3/00 , G10L21/02

Abstract: 本发明提供一种用于家庭环境的基于波束形成的传声器阵列音频输入系统，所述的输入系统采用安放在家庭客厅中的电视机所处周边位置，或者内嵌于电视机内的传声器阵列接受来自用户的音频输入，具体包含：传声器阵列，包含若干传声器阵元用于家庭客厅环境中提取多通道音频信号；波束形成模块，用于实现目标方向语音定向增强，同时抵制来自其它方向的声源；目标语音检测模块判断出目标语音段的起止端点；回波抵消模块，用于去除电视扬声器的声信号；后滤波模块，用于消除不相关的扩散背景噪声。本发明还提供一种基于盲分离的传声器阵列音频输入系统，这两个系统均基于传声器阵列输入音频信号，在家庭网络环境中应用。

6.

发明公开
一种采样率差异估计与校正方法无效

公开(公告)号：CN101894564A

公开(公告)日：2010-11-24

申请号：CN201010228768.6

申请日：2010-07-09

Applicant: 中国科学院声学研究所

Inventor： 付强 , 颜永红 , 覃波

IPC: G10L21/02 , G10L19/00

Abstract: 本发明提供了一种采样率差异估计方法，包括下列步骤：1)分别用两个不同的设备录制同一音源获得两个相关信号x(n)和y(n)；其中n是整数；2)设定采样率差异范围；3)以一定步长，在所述采样率差异范围内进行遍历；4)假定当前采样率为x(n)的实际采样率，求出x(n)与y(n)的互相关函数R12(n)，并记录对应于该当前采样率的互相关函数R12(n)；5)遍历结束后得出对应于最大互相关函数R12(n)的x(n)的采样率，进而得出x(n)与y(n)的采样率差异。本发明能够准确地进行采样率差异估计和校正，从而保证多通道信号处理中不同通道的音频信号流严格同步。

7.

发明公开
基于非监督学习的噪声谱估计与语音活动度检测方法失效

公开(公告)号：CN101853661A

公开(公告)日：2010-10-06

申请号：CN201010178166.4

申请日：2010-05-14

Applicant: 中国科学院声学研究所

Inventor： 应冬文 , 颜永红 , 付强 , 潘接林

IPC: G10L19/00 , G10L21/02

Abstract: 本发明涉及一种基于非监督学习的噪声功率谱估计与语音活动度检测方法，包括下列步骤：1)对于语音信号在每一个频点上的对数幅度特征，建立一个GMM模型；2)对于一段语音数据，设定M帧缓存，把前M帧输入信号存入缓存中，提取缓存中M帧的对数幅度谱，代入步骤1)的GMM模型进行初始化，得到初始化的模型λ0，k；3)在得到初始化的模型λ0，k之后，从第M+1帧开始，采用增量学习的方法，逐帧更新GMM模型，依次递推得到并得出噪声值和语音信号在第i帧的第k个频点上的出现概率。本发明是谱估计与语音活动度检测的紧耦合解决方案，能够增强语音应用系统对噪声环境的适应性；本发明不依赖于“噪声起始”假设，并且，本发明还能够提供语音活动度在时频二维空间上的描述。

8.

发明公开
一种基于小型麦克风阵列的定向语音增强方法失效

公开(公告)号：CN101587712A

公开(公告)日：2009-11-25

申请号：CN200810112195.3

申请日：2008-05-21

Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司

Inventor： 颜永红 , 付强 , 张恒

IPC: G10L21/02

Abstract: 本发明提供一种基于小型麦克风阵列的定向语音增强方法，包括如下步骤：1)利用两个全指向性麦克风采集声音信号；2)利用自适应谷点形成算法，对所采集到声音信号进行数据处理，得到延迟相减信号x(t)和自适应滤波后的信号z(t)；3)对x(t)和z(t)进行处理分别形成语谱X(ω)和Z(ω)；4)根据X(ω)和Z(ω)，利用单通道语音增强方法计算出初步增益G′(ω)；根据X(ω)和Z(ω)，计算出目标信号存在概率P(ω)；5)利用所述目标信号存在概率P(ω)，对初步增益G′(ω)进行修正，得出最终增益G(ω)，，其中Gm为预设的增益最小值；6)利用最终增益G(ω)，对自适应滤波后的信号z(t)进行增强，得到最终的增强语音信号r(t)。本发明能够在很小的体积内，实现定向语音增强算法；并且能够获得更大程度的抑制噪声，提高信噪比。

9.

发明公开
一种基于语义先验的选择性注意的多通道语音增强方法有权

公开(公告)号：CN106531179A

公开(公告)日：2017-03-22

申请号：CN201510574907.3

申请日：2015-09-10

Applicant: 中国科学院声学研究所

Inventor： 付强 , 王晓飞 , 国雁萌 , 颜永红

IPC: G10L21/02

Abstract: 本发明提供了一种基于语义先验的选择性注意的多通道语音增强方法，所述方法包括：多传声器阵列拾取来自于混响环境中的任意方向的语音信号，采集多路语音信号并进行预处理；利用激活词语音识别模型检测预处理后的语音信号中存在的特定激活词；对未经切割的包含激活词段的信号进行处理得到完整的激活词段；采用基于混响鲁棒的多通道相位差声源定位方法对激活词段进行分析，得到目标声源的声波到达方向；对该方向的语音进行增强，并抑制其它方向的噪声以及远讲场景下的房间混响，获取得到目标方向的增强语音。本方明的方法可用于智能家电、智能家居、车载和可穿戴设备等需要远讲式语音输入和交互的场合，特别适用于复杂的声学噪声和干扰环境场合。

10.

发明公开
一种基于音频的车辆监控装置及方法有权

公开(公告)号：CN105989710A

公开(公告)日：2016-10-05

申请号：CN201510073084.6

申请日：2015-02-11

Applicant: 中国科学院声学研究所

Inventor： 纳跃跃 , 付强 , 国雁萌 , 颜永红

IPC: G08G1/01

Abstract: 一种基于音频的车辆监控装置，包括：传声器阵列模块：用于采集并处理车辆发出的噪声信号，得到横向和纵向子阵列的相关矩阵C；车道位置和宽度计算模块：用于计算每个车道的位置和宽度；粗粒度检测区域能量谱计算模块：用于在每个车道上构造两个粗粒度检测区域，并利用相关矩阵C计算两个粗粒度检测区域上的能量谱；自动增益控制模块：用于计算前景阈值α和背景阈值β，对两个粗粒度检测区域上的能量谱进行归一化处理，并判断车辆是否进出两个粗粒度检测区域；车辆计数模块：用于统计每个车道通过的车辆数；车道占有率计算模块：用于计算每个车道的占有率；车速估计模块：用于估计车辆的速度；车型分类模块：用于对车辆的大小类型进行分类。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification