一种多区域不同语音声源的2.5D重放方法

    公开(公告)号:CN106303843B

    公开(公告)日:2018-04-03

    申请号:CN201610616173.5

    申请日:2016-07-29

    IPC分类号: H04R5/02 H04S7/00

    摘要: 本发明公开一种多区域不同语音声源的2.5D重放方法,将S路语音信号变换到频域,提取各频率系数的幅度信息,并基于幅度信息得到空间内各相应目标子声场的二维柱谐展开表达式;基于空间柱谐系数转换理论,通过空间转移算子把S组子区域声场系数转换为一组整体的声场柱谐展开系数;基于空间声场的线性叠加理论和球贝塞尔函数的附加理论,得到高阶扬声器阵列重建声场的三维球谐表达式,在最小均方准则下计算出2.5D重放系统中各高阶扬声器的模式权值;将高阶扬声器模式权值变换到时域,得到高阶扬声器内各指向性扬声器的时域重放信号。本发明解决了实际三维扬声器和二维重建声场间的维度不匹配问题,同时能够在S个区域重放S个不同的声源信号。

    立体声编解码方法、编解码器及编解码系统

    公开(公告)号:CN101572088A

    公开(公告)日:2009-11-04

    申请号:CN200810094436.6

    申请日:2008-04-30

    IPC分类号: G10L19/00 H03M7/40 H04L1/00

    摘要: 本发明实施例公开了一种立体声编解码方法、编解码器及编解码系统,涉及多媒体技术领域,能够编解码嵌入式立体声信号。所述立体声编码方法包括:对立体声信号的采样率进行判断,选择相应的编码模式;对立体声信号的左右声道进行求均值、求差值,分别得到立体声信号的中值信号和边带信号;对所述中值信号和边带信号分别进行编码形成嵌入式结构的码流。相对于编码过程,所述立体声解码方法对嵌入式结构的码流选择不同的码率层进行解码,分别解出中值信号与边带信号得到中值信号与边带信号合成得到立体声信号。本发明实施例通过构建多个码率层,可以处理16kHz采样的宽带立体声信号和32kHz采样的超宽带立体声信号。

    一种利用声源间稀疏成分均衡的多声源定位方法

    公开(公告)号:CN110398716B

    公开(公告)日:2021-05-28

    申请号:CN201910784643.2

    申请日:2019-08-23

    摘要: 本发明提出一种利用声源间稀疏成分均衡的多声源定位方法,通过均衡各声源的稀疏成分以获得更准确的方向估计。首先将声场麦克风信号变换到频域得到频域系数,对其按频率范围进行子带划分并计算声场麦克风各通路间的归一化互相关系数;其次,检测单声源子带,估计单声源子带内各时‑频点的角度;再次,利用均衡处理区间内各帧的帧内强稀疏性声源确定区间强稀疏性声源,结合历史均衡处理区间的时‑频点角度估计值和区间强稀疏性声源确定全局强稀疏性声源角度并设立移除范围,对当前均衡处理区间内角度估计值落入移除范围的时‑频点成分进行移除;最后,对若干个经过均衡处理后的区间内的时‑频点角度估计值进行后处理以获得各声源角度的准确估计。

    一种利用优势声源成分移除的多声源定位方法

    公开(公告)号:CN110275138A

    公开(公告)日:2019-09-24

    申请号:CN201910640408.8

    申请日:2019-07-16

    IPC分类号: G01S5/20

    摘要: 本发明提出一种利用优势声源成分移除的多声源定位方法,通过移除优势声源成分使声场景内各声源的波达方向估计更准确。首先,将声场麦克风采集信号变换到频域获得频率系数,对频域信号按频率范围进行子带划分并计算声场麦克风各通路间相同频率范围子带的归一化互相关系数;其次,检测单声源子带,对单声源子带内各时-频点对应角度进行估计;再次,利用各个历史帧的帧内优势声源确定全局候选优势声源,结合时-频点角度估计值和全局候选优势声源确定全局优势声源角度并设立移除区间,对当前帧角度估计值落入移除区间的时-频点成分进行移除;最后,对若干帧经过移除处理后的时-频点角度估计值进行后处理以获得各声源角度的准确估计。

    一种多区域不同语音声源的2.5D重放方法

    公开(公告)号:CN106303843A

    公开(公告)日:2017-01-04

    申请号:CN201610616173.5

    申请日:2016-07-29

    IPC分类号: H04R5/02 H04S7/00

    摘要: 本发明公开一种多区域不同语音声源的2.5D重放方法,将S路语音信号变换到频域,提取各频率系数的幅度信息,并基于幅度信息得到空间内各相应目标子声场的二维柱谐展开表达式;基于空间柱谐系数转换理论,通过空间转移算子把S组子区域声场系数转换为一组整体的声场柱谐展开系数;基于空间声场的线性叠加理论和球贝塞尔函数的附加理论,得到高阶扬声器阵列重建声场的三维球谐表达式,在最小均方准则下计算出2.5D重放系统中各高阶扬声器的模式权值;将高阶扬声器模式权值变换到时域,得到高阶扬声器内各指向性扬声器的时域重放信号。本发明解决了实际三维扬声器和二维重建声场间的维度不匹配问题,同时能够在S个区域重放S个不同的声源信号。

    短时能量及梅尔倒谱系数联合新型矢量量化的低复杂度危险声场景判别方法

    公开(公告)号:CN110610722B

    公开(公告)日:2022-02-08

    申请号:CN201910914499.X

    申请日:2019-09-26

    发明人: 贾懋珅 赵文兵

    IPC分类号: G10L25/51 G10L25/24

    摘要: 本发明属于智能应用型声场判别领域,具体涉及一种短时能量及梅尔倒谱系数联合矢量量化的危险声场景判别方法。该方法具体包括危险声场景声音库的建立、构建音频时频复合特征参数、引入改进型矢量量化模型对音频特征参数训练;在危险声场景匹配阶段利用欧式距离测度算法进行失真度匹配,找到最小平均误差失真度作为最佳匹配进而达到识别效果。

    一种利用活动强度矢量加权移除野点的多声源定位方法

    公开(公告)号:CN113189544A

    公开(公告)日:2021-07-30

    申请号:CN202110465158.6

    申请日:2021-04-23

    IPC分类号: G01S5/22

    摘要: 本发明提出一种利用活动强度矢量加权移除野点的多声源定位方法,通过移除在定位过程中贡献较低的时频点以在混响条件下获得更准确的方位估计。首先提取单声源区域。其次,计算单声源区域内部每个点的活动强度矢量和区域平均活动强度矢量,求取点‑区域活动强度权值并对时频点赋权。获取各个声源DOA粗估计方向上的活动强度矢量,计算点‑声源活动强度权值。最后,构建复合权值,对该复合权值进行聚类以移除野点。利用剩余点的复合权值构建的直方图,通过后处理和峰值搜索对声源位置进行估计,最小化野点对定位精度的影响,实现高混响声场景下的多声源精确定位。

    一种利用变换域稀疏化和压缩降维的音频检索方法

    公开(公告)号:CN110647656B

    公开(公告)日:2021-03-30

    申请号:CN201910876038.8

    申请日:2019-09-17

    IPC分类号: G06F16/683 G06F16/632

    摘要: 本发明智能应用型音频信号处理领域,具体涉及一种利用变换域稀疏化和压缩降维的音频检索方法。该方法用音频指纹作为音频检索特征,本技术在音频检索的训练阶段通过利用变换域稀疏化和压缩降维先对样本音频数据进行压缩,再对压缩后的音频序列提取音频指纹,使得提取的音频指纹数据量减小,从而减小样本音频指纹库的数据量。在音频检索的识别(检索)阶段用相同的算法压缩待检音频后提取待检音频指纹和样本音频指纹匹配很大程度上提高了检索效率。

    一种沉浸式宽带3D声场重放方法

    公开(公告)号:CN108632709A

    公开(公告)日:2018-10-09

    申请号:CN201810352481.0

    申请日:2018-04-19

    IPC分类号: H04R3/00

    摘要: 本发明公开一种沉浸式宽带3D声场重放方法,首先,计算在指定空间位置放置的场景A的虚拟声源到场景B中各个听音点的声学传输函数,将该函数值作为虚拟声源辐射声场的声压值;其次,设定场景B中某一墙面的扬声器阵列为规则的矩形等间距布局,并基于声波的波动特性,利用格林函数来建模所有扬声器到听音点的声学传播特征;再次,基于线性凸优化理论,将l1范数作为稀疏规则算子利用交替方向乘子法进行正则化运算,选取1倍频程内八个频带的中心频率计算扬声器权值,进行激活扬声器选取。最后,利用l2范数正则化,计算重放系统中激活扬声器的权值信号,使得在最小均方准则下,待重放声源的辐射声场和激活扬声器的辐射声场最接近。

    一种基于球谐展开的多声道转换方法

    公开(公告)号:CN103888889A

    公开(公告)日:2014-06-25

    申请号:CN201410137391.1

    申请日:2014-04-07

    IPC分类号: H04S3/00

    摘要: 本发明提出一种基于球谐展开的多声道转换方法,主要适用于将L1路多声道扬声器系统转换为L2路多声道扬声器系统。基于声场的线性叠加理论,根据声道数的不同采用相应阶数的球谐函数分别计算转换前后扬声器系统的声场,在保证转换前后扬声器系统在一定阶数下球谐展开声场相同的情况下,计算出转换后系统各个扬声器的增益系数。本发明实时运算复杂度低,能够在转换后系统上恢复出听音区域内原始重放系统的声场,可用于多声道三维音频系统的精简压缩及上混合技术,可以有效地兼容各种扬声器重放系统及减少传输带宽。