一种音频混响的抑制装置及其抑制方法

    公开(公告)号:CN103440869A

    公开(公告)日:2013-12-11

    申请号:CN201310398174.3

    申请日:2013-09-03

    摘要: 本发明公开了一种音频混响的抑制装置及其抑制方法,所述的装置包括混响时间盲估计模块、后期混响功率谱估计模块、谱减模块和复倒谱域滤波模块。混响语音通过混响时间盲估计模块,估计出混响时间;后期混响功率谱估计模块利用所估计出的混响时间来建立混响统计模型,并对混响语音进行分析处理,得到后期混响功率谱;谱减模块包括增益函数构造和谱减实施模块,先用混响语音功率谱和后期混响功率谱构造出谱减增益函数;再将谱减增益函数和混响语音输入谱减实施模块,得到前期语音;最后将前期语音输入到复倒谱域滤波模块,得到去混响的语音。本发明计算复杂度较低,便于实时处理,能明显抑制音频混响,有效提高语音质量。

    一种面部图像中特征点的定位方法

    公开(公告)号:CN103440510A

    公开(公告)日:2013-12-11

    申请号:CN201310393764.7

    申请日:2013-09-02

    发明人: 陈喆 殷福亮 唐坤

    IPC分类号: G06K9/66

    摘要: 本发明公开了一种面部图像中特征点的定位方法,属于信号处理技术领域。本发明包括模型训练阶段和图像搜索阶段;在模型训练阶段,选取足够数量的正常人脸图像和不同光照下的人脸图像作为训练集合,手工标定好每幅训练图像准确的特征点位置,并建立活动形状模型和局部纹理模型,该模型训练阶段仅需执行一次;在图像搜索阶段,首先确定目标图像准确的瞳孔位置,以初始化活动形状模型的初始位置,然后通过迭代使模型拟合到准确的目标特征点位置。

    一种用于分布式麦克风阵列的声源定位系统及定位方法

    公开(公告)号:CN103439688A

    公开(公告)日:2013-12-11

    申请号:CN201310379053.4

    申请日:2013-08-27

    IPC分类号: G01S5/20

    摘要: 本发明公开了一种用于分布式麦克风阵列的声源定位系统及其定位方法,所述的系统包括信号能量比计算模块A、数据库建立模块、GMM训练模块、信号能量比计算模块B和声源坐标计算模块;信号能量比计算模块A的输出端与数据库建立模块输入端连接;数据库建立模块输出端与GMM训练模块输入端连接,GMM训练模块输出端与声源坐标计算模块输入端连接;信号能量比计算模块B的输出端也与声源坐标计算模块输入端连接;声源坐标计算模块输出端输出声源坐标。由于本发明采用麦克风接收信号能量作为主要参数,仅与该麦克风和声源间的距离有关,故无需考虑阵列几何结构与尺寸信息,也无需考虑声音信号传输延迟时间、平稳性、宽带或窄带等因素。

    一种室内混响消除的方法
    124.
    发明公开

    公开(公告)号:CN103413547A

    公开(公告)日:2013-11-27

    申请号:CN201310317200.5

    申请日:2013-07-23

    IPC分类号: G10K11/16 G10K15/08

    摘要: 本发明涉及一种室内混响消除的方法,属于信号处理技术领域。本发明包括后期混响功率率谱估计模块,谱减模块,有音/无音检测模块,能量衰减模块以及自适应谱线增强模块;所述的后期混响功率谱估计模块输入为混响语音,输出与谱减模块连接;谱减模块的输入为混响语音和后期混响功率谱估计模块的输出,输出与有音/无音检测模块相连;有音/无音检测模块输出控制谱减模块的输出选择可连接能量衰减模块或连接自适应谱线增强模块;能量衰减模块和自适应谱线增强模块输出最终的增强后的语音。

    一种AMR码流转换成AMR-WB码流的方法

    公开(公告)号:CN103337243A

    公开(公告)日:2013-10-02

    申请号:CN201310272820.1

    申请日:2013-06-28

    IPC分类号: G10L19/24 G10L19/12

    摘要: 本发明公开了一种AMR码流转换成AMR-WB码流的方法,属于编码技术领域。一种AMR码流转换成AMR-WB码流的方法;AMR窄带码进入扩展单元后转换成AMR-WB码流,扩展单元和训练单元,所述的训练单元为扩展单元提供参数扩展过程所需的映射关系。

    一种基于音频水印的语音带宽扩展的装置和方法

    公开(公告)号:CN102543086A

    公开(公告)日:2012-07-04

    申请号:CN201110422392.7

    申请日:2011-12-16

    IPC分类号: G10L19/00

    摘要: 本发明公开了一种基于音频水印的语音带宽扩展的装置及方法。该装置及方法:开始部分,人发出的语音是宽带信号,在通过电话线传输之前,将高频参数嵌入到窄带码流中,通过电话线传输窄带语音信号;在接收端进行A律解码,然后提取高频参数,使用此高频参数恢复宽带语音中的高频部分,最后将高频语音和低频语音合成宽带语音。该装置及方法利用音频水印的特性,在窄带语音中建立一条隐藏的信道,利用此信道传输高频语音的参数,从而在不改变原有网络协议的前提下,实现了语音信号的频带扩展。

    一种基于G.711.1的语音带宽扩展的装置和方法

    公开(公告)号:CN102522092A

    公开(公告)日:2012-06-27

    申请号:CN201110422386.1

    申请日:2011-12-16

    IPC分类号: G10L21/02

    摘要: 本发明公开了一种基于G.711.1的语音带宽扩展的装置和方法。本发明将G.711.1协议中的高频语音码流进一步压缩,将压缩后的数据使用最低有效位的水印嵌入算法嵌入到窄带语音的编码码流中,解码端使用提取出的高频码流合成宽带语音的高频部分,从而得到宽带语音。本发明提供了分层编码的新解决方案,在窄带语音的传输中建立一条隐藏的信道,用于传输分层编码协议中高频信号的编码码流。这样既利用了分层编码得出宽带语音听觉效果好的优势,同时不会改变现有网络的传输速率。经仿真测试,该方法得到的宽带语音引入的高频噪声小,听觉效果跟原始宽带语音相差极小。

    一种基于音频处理的管道泄漏检测方法及系统

    公开(公告)号:CN115264408B

    公开(公告)日:2024-07-12

    申请号:CN202210732172.2

    申请日:2022-06-23

    IPC分类号: F17D5/06

    摘要: 本发明公开了一种基于音频处理的管道泄漏检测方法及系统,其中方法具体包括:对采集到音频的时域长序列信号x(n)进行时域分帧加窗预处理获得多帧信号;针对音频信号,提取出具有良好分类效果的音频特征:采用傅里叶变换对帧信号进行处理获得信号的频谱分布,将频谱进行特定的切分,计算不同频带的能量占比,得到单帧特征分布;得到联合特征:利用多帧信号的动态特征,将多帧信号串联输入,构成了高维联合特征;将得到的音频特征输入到训练好的神经网络模型中,网络输出为帧标签值;统计得到的帧标签结果,进行标签平滑与标签融合,最终得到管道是否存在泄漏的判决结果。

    一种期望声源方向可调的双麦克风降噪方法

    公开(公告)号:CN114724574B

    公开(公告)日:2024-07-05

    申请号:CN202210157383.8

    申请日:2022-02-21

    摘要: 本发明公开了一种期望声源方向可调的双麦克风降噪方法,包括:预处理过程,将双麦克风接收的带噪信号x1(t)和x2(t)进行离散采样、预加重、分帧及加窗处理,再经过短时傅里叶变换,得到频域信号X1(ω)和X2(ω);波束形成过程,在双麦克风连线的中点处引入虚拟麦克风,根据中心差分格式对频域信号X1(ω)和X2(ω)进行差分变换,构造差分信号Y1(ω)和Y2(ω)。计算差分信号Y1(ω)和Y2(ω)的功率谱的统计平均值,并将统计平均值的比值记为方向性函数Γ(ω,θ),分析方向性函数Γ(ω,θ)的性质,通过归一化函数将其直接映射为噪声掩蔽值λ(ω)。将X1(ω)与λ(ω)相乘得到消除掉竞争方向噪声后的信号R1(ω);后置维纳滤波过程,对R1(ω)中的信号能量和噪声能量进行估计得到通道信噪比并计算增益函数,进一步消除R1(ω)中的残余噪声。

    一种鲁棒的分布式说话人噪声消除系统

    公开(公告)号:CN114724571B

    公开(公告)日:2024-05-03

    申请号:CN202210329198.2

    申请日:2022-03-29

    IPC分类号: G10L21/0208 G10L25/27

    摘要: 本发明公开了一种鲁棒的分布式说话人噪声消除系统,包括离散傅里叶变换模块、语音活动检测模块、信噪比计算模块、树形拓扑修剪模块、数据驱动比较模块、数据压缩模块、根节点运算模块、协方差矩阵估计模块、滤波器更新模块、结果传递模块、根节点更新模块和离散傅里叶反变换模块。本发明是一种可以应用在任意网络拓扑连接下的鲁棒分布式说话人噪声消除技术,它通过将任意网络拓扑修剪为树形拓扑,并在树形拓扑下完成了输入信噪比的比较,这使得对于运动说话人具有一定的鲁棒性,即无论说话人的位置在哪里,拥有最大输入信噪比的节点总是可以被找到,最终进行分布式说话人噪声消除。