-
公开(公告)号:CN105981404B
公开(公告)日:2019-06-04
申请号:CN201480066907.6
申请日:2014-12-02
申请人: 弗朗霍夫应用科学研究促进协会
IPC分类号: H04R3/00 , G10L21/0208
CPC分类号: G10L21/0264 , G10L19/26 , G10L21/02 , G10L21/0208 , G10L2021/02082 , G10L2021/02166 , G11B2020/10601 , H04R3/005 , H04R5/027 , H04S2400/15 , H04S2420/01
摘要: 方法包括估计第一麦克风信号中的第一散射声部分和第二麦克风信号中的第二散射声部分之间的空间相干性。第一麦克风信号由第一麦克风捕捉,第二麦克风信号由与第一麦克风以已知的方式间隔开的第二麦克风捕捉。方法进一步包括定义散射声滤波器的滤波系数的线性约束,线性约束基于空间相干性。方法还包括计算第一麦克风信号和第二麦克风信号的信号统计和噪声统计中的至少一个。方法还包括通过在考虑滤波系数的线性约束的条件下对关于信号统计和噪声统计中的至少一个的优化问题求解,确定散射声滤波器的滤波系数。
-
公开(公告)号:CN107358964A
公开(公告)日:2017-11-17
申请号:CN201710223382.8
申请日:2017-04-07
申请人: 哈曼国际工业有限公司
IPC分类号: G10L21/0232 , G10L21/0264 , G10L21/0388 , G10L25/78 , H04R1/10 , G10L25/21
CPC分类号: H04R1/1083 , G10L21/0232 , G10L21/0264 , G10L21/0388 , G10L25/21 , G10L2025/786 , G10L25/78
摘要: 在音频系统中,音频信号被预先处理以向快速检测器和慢速检测器提供输入信号,所述输入信号包括警戒信号和环境声。所述慢检测器确定被输出到警戒信号检测器的所述输入信号的环境声电平。所述警戒信号检测器使用所述环境声电平来使用自适应阈值函数计算自适应阈值电平。所述快速检测器确定被输出到所述警戒信号检测器的所述输入信号的包络电平。所述警戒信号检测器比较所述包络电平与所述自适应阈值电平以确定警戒信号是否存在于所述输入信号中。所述自适应阈值电平根据所述输入信号的所述环境声电平而改变,且所述音频系统的所述警戒信号检测自动适应于具有不同的环境声电平的变化的声环境。
-
公开(公告)号:CN106782592A
公开(公告)日:2017-05-31
申请号:CN201611228509.7
申请日:2016-12-27
申请人: 中山大学花都产业科技研究院 , 中山大学
IPC分类号: G10L21/0208 , G10L21/0264
CPC分类号: G10L21/0208 , G10L21/0264 , G10L2021/02082
摘要: 本发明公开了一种用于消除网络声音传输的回音和啸叫的系统和方法,一方面,本发明提供了一种用于消除网络声音传输的回音和啸叫的方法,实时将远端输入的音频信号进行降采样得到第一处理音频信号;实时将麦克风采集到的音响发出的声音和近端输入的声音的混合音频信号进行降采样得到第二处理音频信号;实时将第二处理音频信号中与第一处理音频信号相关的信号进行提取升采样得到第三处理音频信号;实时将麦克风采集到的混合音频中与第三处理音频信号相关的信号消除得到消除了回音和啸叫的输出音频信号。另一方面,本发明提供了一种用于消除网络声音传输的回音和啸叫的系统。本发明可有效消除网络声音传输的回音和啸叫,保证音频质量。
-
公开(公告)号:CN106448661A
公开(公告)日:2017-02-22
申请号:CN201610847518.8
申请日:2016-09-23
申请人: 华南理工大学
IPC分类号: G10L15/06 , G10L15/08 , G10L15/14 , G10L15/20 , G10L21/0216 , G10L21/0264
CPC分类号: G10L15/063 , G10L15/08 , G10L15/14 , G10L15/20 , G10L21/0216 , G10L21/0264
摘要: 本发明提供一种基于纯净语音与背景噪声两极建模的音频类型检测方法,包括步骤:S1、构建纯净语音GMM模型以及纯粹背景噪声GMM模型;S2、计算纯净语音模型自身各高斯混元间的距离,判断高斯混元是否位于特征重叠空间;S3、剔除位于特征重叠空间中的高斯混元,重新构建纯净语音统计模型、纯粹背景噪声统计模型;S4、计算新的纯净语音统计模型、纯粹背景噪声统计模型的概率,以及估算音频样本信噪比;S5、根据计算得到的概率以及估算信噪比,构建特征矢量且利用SVM模型进行判决,将样本判别为纯净语音、背景噪声或含噪声语音。本发明在降低GMM-SVM运算量的同时,能有效地区分纯净语音、纯净背景噪声和含噪声语音。
-
公开(公告)号:CN106067301A
公开(公告)日:2016-11-02
申请号:CN201610357764.5
申请日:2016-05-26
申请人: 浪潮(苏州)金融技术服务有限公司
IPC分类号: G10L21/0264
CPC分类号: G10L21/0264
摘要: 本发明公开了一种使用多维化技术进行回声降噪的方法,其实现过程为:根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;导出合成后的音频数据。该一种使用多维化技术进行回声降噪的方法与现有技术相比,整个降噪过程中并不需要对采集设备做特别的要求,因此相对于专业的向音频采集设备来,具有成本低、部署简便,以及对用户的专业水平要求较低等优势;实用性强,适用范围广泛,该技术可被广泛的应用于各种平台上的VoIP产品之中,对提升通话质量,提高服务品质都具有重要的作用,易于推广。
-
公开(公告)号:CN102986136B
公开(公告)日:2016-02-10
申请号:CN201180030337.1
申请日:2011-04-20
申请人: 弗劳恩霍夫应用研究促进协会
IPC分类号: H03G9/00 , H03G9/02 , G10L21/00 , G10L21/0364
CPC分类号: G10L21/00 , G10L21/0264 , G10L21/0364 , G10L25/69 , H03G9/005 , H03G9/025
摘要: 一种修改输入音频信号的装置包括激励确定器、存储设备以及信号修改器。所述激励确定器基于输入音频信号的多个子带中的一个子带的能含量确定所述子带的激励参数值。此外,所述存储设备存储包含多个频谱权重因子的查找表。多个频谱权重因子中的一个频谱权重因子与激励参数的预定义值以及多个子带中的一个子带相关联。所述存储设备提供与激励参数的确定值对应以及与确定了激励参数值的子带对应的频谱权重因子。此外,所述信号修改器基于所提供的频谱权重因子修改确定了激励参数值的音频信号的子带的内容以提供修改的子带。
-
公开(公告)号:CN104781880A
公开(公告)日:2015-07-15
申请号:CN201280076853.2
申请日:2012-09-03
申请人: 弗兰霍菲尔运输应用研究公司
IPC分类号: G10L25/78
CPC分类号: G10L15/14 , G10L21/0208 , G10L21/0264 , G10L25/78 , G10L2021/02166
摘要: 提供一种用于提供语音概率估计的装置。所述装置包括用于估计表示场景的声场是否包括语音或场景的声场是否不包括语音的第一概率的语音概率信息的第一语音概率估计器(110)。另外,所述装置包括用于根据所述语音概率信息输出语音概率估计的输出接口(120)。所述第一语音概率估计器(110)配置为至少基于关于声场的空间信息或场景的空间信息估计第一语音概率信息。
-
公开(公告)号:CN104205214A
公开(公告)日:2014-12-10
申请号:CN201380012027.6
申请日:2013-02-08
申请人: 国际商业机器公司
IPC分类号: G10L21/0264 , G10L15/20 , G10L21/0216
CPC分类号: G10L21/0264 , G10L15/20 , G10L21/0216
摘要: 本发明的目的在于提供一种在语音识别中的基于模型的噪声降低的创新技术。本发明在基于模型的噪声补偿中生成概率模型,该概率模型被表示为具有观测值y作为因数的失配向量g(或干净语音x)的概率分布和具有针对每个频带的置信度指数β作为因数的失配向量g(或干净语音x)的概率分布的乘积,在概率模型上执行MMSE估计,以及估计干净语音估计值x^。因此,每个频带以根据它的置信度级别的贡献程度来影响MMSE估计的结果。进一步地,观测语音的S/N比率越高,输出值越加变得偏移到观测值。因此,前端的输出被优化。
-
公开(公告)号:CN102414746B
公开(公告)日:2013-08-28
申请号:CN201080019733.X
申请日:2010-04-29
申请人: 杜比实验室特许公司
发明人: D·S·麦克格拉斯
CPC分类号: H03G9/18 , G10L21/0205 , G10L21/0264 , G10L21/0364 , H03G9/005 , H03G9/025
摘要: 使用具有高频响应特性和低频响应特性的可动态控制滤波器在减少音频信号的感知谱平衡的改变的同时调整该音频信号的响度,该可动态控制滤波器通过动态改变关于该音频信号的多个频带中的每一个频带中的期望增益的信息而被控制。
-
公开(公告)号:CN101620855B
公开(公告)日:2013-08-07
申请号:CN200910132052.3
申请日:2009-04-15
申请人: 富士通株式会社
CPC分类号: G10L25/78 , G10L15/20 , G10L21/0208 , G10L21/0264 , G10L21/0364 , G10L2021/02165 , H03G3/32 , H04R3/04 , H04R2430/03
摘要: 公开了一种语音增强装置。所公开的语音增强装置包括:SNR计算单元,其计算作为接收到的语音与环境噪声之比的SNR;第一频率范围增强量计算单元,其基于所述SNR和指示了第一频率范围和第二频率范围的频率范围划分信息来计算所述第一频率范围的增强量,所述第一频率范围有助于改善所述接收到的语音的主观可理解度,所述第二频率范围有助于改善所述接收到的语音的主观清晰度;第二频率范围增强量计算单元,其基于所述第一频率范围的增强量来计算所述第二频率范围的增强量;以及频谱处理单元,其利用所述第一频率范围的增强量、所述第二频率范围的增强量以及所述频率范围划分信息来处理所述接收到的语音的频谱。
-
-
-
-
-
-
-
-
-