语音激活检测方法、装置和电子设备

    公开(公告)号:CN102044242B

    公开(公告)日:2012-01-25

    申请号:CN200910206840.2

    申请日:2009-10-15

    发明人: 王喆

    IPC分类号: G10L11/02

    CPC分类号: G10L25/78 G10L25/09

    摘要: 本发明实施例公开了语音激活检测方法、装置和电子设备。其中的方法包括:从音频帧中获取时域分类参数和频域分类参数,获取所述时域分类参数与时域分类参数在历史背景噪声帧中的长时滑动平均值之间的第一距离,获取所述频域分类参数与频域分类参数在历史背景噪声帧中的长时滑动平均值之间的第二距离,根据所述第一距离和第二距离以及基于所述第一距离和第二距离的判决多项式组判决所述音频帧为前景语音帧还是为背景噪声帧,所述判决多项式组中的至少一个系数为变量,所述变量随语音激活检测工作方式或输入信号特征而变化。上述技术方案可使判决准则具有自适应调节能力,从而提高了语音激活检测的性能。

    语音激活检测方法、装置和电子设备

    公开(公告)号:CN102044242A

    公开(公告)日:2011-05-04

    申请号:CN200910206840.2

    申请日:2009-10-15

    发明人: 王喆

    IPC分类号: G10L11/02

    CPC分类号: G10L25/78 G10L25/09

    摘要: 本发明实施例公开了语音激活检测方法、装置和电子设备。其中的方法包括:从音频帧中获取时域分类参数和频域分类参数,获取所述时域分类参数与时域分类参数在历史背景噪声帧中的长时滑动平均值之间的第一距离,获取所述频域分类参数与频域分类参数在历史背景噪声帧中的长时滑动平均值之间的第二距离,根据所述第一距离和第二距离以及基于所述第一距离和第二距离的判决多项式组判决所述音频帧为前景语音帧还是为背景噪声帧,所述判决多项式组中的至少一个系数为变量,所述变量随语音激活检测工作方式或输入信号特征而变化。上述技术方案可使判决准则具有自适应调节能力,从而提高了语音激活检测的性能。

    音频编码方法、音频解码方法、编码端、解码端和系统

    公开(公告)号:CN103413553B

    公开(公告)日:2016-03-09

    申请号:CN201310364530.X

    申请日:2013-08-20

    IPC分类号: G10L19/028 G10L19/032

    摘要: 本发明公开了一种音频编码方法、音频解码方法、编码端、解码端和系统,属于网络技术领域。所述方法包括:根据音频参数确定音频信号是否为指定信号类型;对属于指定信号类型的音频信号和/或不属于指定信号类型的音频信号进行标记;其中,标记过程可以在编码端或者解码端进行,用于在解码时对指定信号类型的音频信号进行增强处理。本发明通过音频参数确定音频信号是否为指定信号类型,只对指定信号类型进行增强,解决了音频信号由于编解码而引入的量化噪声在对音频信号进行增强的同时也被增强而影响音频信号的感知的问题;达到了保证音频信号的感知的效果,并且相对于传统的从时域变换到频域中进行增强的方法减少了运算复杂度。

    音频处理系统与音频处理方法

    公开(公告)号:CN103839551A

    公开(公告)日:2014-06-04

    申请号:CN201210477149.X

    申请日:2012-11-22

    发明人: 叶源

    IPC分类号: G10L21/02

    摘要: 本发明涉及一种音频处理系统及方法,该音频处理系统应用于电子设备中,电子设备用于接收音频信息,音频信息包括第一信号及第二信号,第一信号为影响电子设备音频输出效果的信号,第二信号的幅值大于第一信号的幅值,电子设备包括处理器及储存器,存储器存储表示第一信号特征的预设过零率、第一幅值及第二幅值,第一、第二幅值分别表示第一信号的最大幅值及最小幅值,音频处理系统包括:获取模块,用于获取音频信息;划分模块,将音频信息划分为若干个音频段落;读取模块,读取音频段落内的语音信号的过零率及幅值;判断模块,判断当前音频段落内的语音信号是否为第一信号;及处理模块,将第一信号进行抑制处理以消除第一信号。

    音频信号处理装置、音频信号处理方法和程序

    公开(公告)号:CN102348150A

    公开(公告)日:2012-02-08

    申请号:CN201110206440.9

    申请日:2011-07-22

    申请人: 索尼公司

    发明人: 关矢俊之

    IPC分类号: H04R3/00

    摘要: 本发明提供了一种音频信号处理装置,包括:幅度检测器,配置为通过将包括噪声信号的音频信号的幅度值与阈值比较,检测所述音频信号的噪声开始点;频率特征计算器,配置为计算至少表示所述噪声开始点之后的音频信号的频率特性的频率特征;以及噪声确定器,配置为基于所述频率特征,确定在所述噪声开始点之后的音频信号中连续包括等于或高于参考频率的高频分量的段,作为噪声段。

    音频编解码系统与音频编解码方法

    公开(公告)号:CN107665713A

    公开(公告)日:2018-02-06

    申请号:CN201710034582.9

    申请日:2017-01-17

    IPC分类号: G10L19/00 G10L19/16 G10L25/21

    摘要: 本发明揭露一种音频编解码系统及其方法。其中所述音频编解码系统包含:存储器,用于缓存音频帧;信号功率检测器,用于检测缓存在所述存储器的所述音频帧的信号功率电平,以生成信号功率前瞻值;过零检测器,对于所述信号功率前瞻值的改变,配置所述过零检测器检测缓存在所述存储器的所述音频帧的过零点,以取得增益控制的可用校准点;以及动态范围增强增益控制器,用于将所述增益控制划分在所述可用校准点执行。本发明提供的音频编解码系统与音频编解码方法可取得平滑并且具有无缝编解码性能的增益控制。