音频信号的分类方法及装置

    公开(公告)号:CN101847412A

    公开(公告)日:2010-09-29

    申请号:CN200910129157.3

    申请日:2009-03-27

    IPC分类号: G10L19/02 G10L15/08

    摘要: 本发明的实施例公开了一种音频信号的分类方法及装置,涉及通信技术领域,解决了现有技术中在对音频信号的类型进行分类时,分类复杂度高问题。本发明实施例在接收到待分类音频信号后,获取待分类音频信号在至少一个子带中的音调特征参数;根据获取的特征参数判定所述待分类音频信号的类型。本发明实施例主要应用于对音频信号进行分类时的场景,实现可通过较简单的方法完成对音频信号的分类。

    一种在编解码中调整量化质量的方法和装置

    公开(公告)号:CN101192410B

    公开(公告)日:2010-05-19

    申请号:CN200610164330.X

    申请日:2006-12-01

    IPC分类号: G10L19/14 G10L19/08 H03M7/30

    CPC分类号: G10L19/032

    摘要: 本发明公开了一种在编码中调整量化质量的方法,该方法包括:利用两个或两个以上缩放因子,对用于编码的第一采样值进行调整后,对调整后的第一采样值进行量化得到量化采样值;从所得到的量化采样值中去除缩放因子的影响得到第二采样值,并利用第一采样值和第二采样值得到全局增益;将所得到的量化采样值、所述两个或两个以上的缩放因子的信息以及所得到的全局增益作为编码流输出。本发明还公开了一种在解码中调整量化质量的方法,在编码、解码中调整量化质量的装置。根据本发明公开的方法和装置,能够大大降低实现复杂度,能够更好地调整重要部分的量化质量,能够获得更好的编码效果。

    一种噪声整形的方法和装置

    公开(公告)号:CN101388215A

    公开(公告)日:2009-03-18

    申请号:CN200710153953.1

    申请日:2007-09-15

    摘要: 本发明提供了一种噪声整形的方法和装置,对语音信号s(n)进行自适应的噪声整形处理,得到信号s1(n);对所述信号s1(n)进行固定的噪声整形处理,得到信号u(n);对信号u(n)进行语音编码,形成编码端的输出信号。还提供了一种噪声整形的方法和装置,将语音信号s(n)进行固定的噪声整形处理,得到信号s1′(n);对所述信号s1′(n)进行自适应的噪声整形处理,得到信号u′(n);对所述信号u′(n)进行语音编码,形成编码端的输出信号。由于固定的噪声整形处理和自适应的噪声整形处理均是对语音信号本身所做的噪声整形处理,而不涉及语音信号与预测滤波器的残差信号,所以,在解码端不需要做任何改变即可解码还原出经噪声整形的语音信号。

    声音信号分类方法和装置
    25.
    发明公开

    公开(公告)号:CN101197135A

    公开(公告)日:2008-06-11

    申请号:CN200610164456.7

    申请日:2006-12-05

    IPC分类号: G10L19/14 G10L19/08 G10L19/00

    CPC分类号: G10L25/78 G10L19/20

    摘要: 本发明公开了一种声音信号分类方法,包括:接收声音信号,根据背景噪声频谱分布参数和所述声音信号的频谱分布参数确定背景噪声的更新速率;根据所述更新速率对噪声参数进行更新,并根据子带能量参数和更新后的噪声参数对所述声音信号进行分类。本发明还公开了一种声音信号分类装置,包括:背景噪声参数更新模块,用于根据背景噪声频谱分布参数和当前声音信号的频谱分布参数确定背景噪声的更新速率,并发送所述确定的更新速率;PSC模块,用于接收来自所述背景噪声参数更新模块的更新速率,对噪声参数进行更新,并根据子带能量参数和更新后的噪声参数对当前声音信号进行分类,并发送分类确定的声音信号类型。

    根据频域能量对语音信号进行处理的方法和装置

    公开(公告)号:CN104934032B

    公开(公告)日:2019-04-05

    申请号:CN201410098869.4

    申请日:2014-03-17

    发明人: 许丽净

    摘要: 本发明实施例提供一种根据频域能量对语音信号进行处理的方法和装置。本发明的根据频域能量对语音信号进行处理的方法和装置包括:接收包括相邻的第一语音帧和第二语音帧的原始语音信号;分别对所述第一语音帧和所述第二语音帧进行傅里叶变换得到第一频域信号和第二频域信号,并得到所述第一语音帧和所述第二语音帧的频域能量分布;然后得到所述第一语音帧和所述第二语音帧的频域能量相关性系数;根据所述频域能量相关性系数对所述原始语音信号进行分段。本发明实施例可以解决在进行语音信号精细分段时,由于语音信号音素本身的特征或是较强噪声的影响,导致语音信号分段结果准确性不高的问题。

    语音质量监控的方法和装置

    公开(公告)号:CN103716470B

    公开(公告)日:2016-12-07

    申请号:CN201210375963.0

    申请日:2012-09-29

    IPC分类号: H04M3/22 G10L25/60

    摘要: 一种语音质量监控的方法和装置,解决了使用较低的成本,对较长的音频信号进行合理的语音质量监控的难题。方法包括:从输入的信号中截取一个或多个语音信号段;对每个语音信号段进行语段分割,获得一个或多个语段;对语段进行语音质量评估,根据语音质量评估获得质量评估结果。与方法对应的装置包括分类单元、语段分割单元、质量评估单元上述技术方案,通过对输入的信号进行信号分类;对分类后截取的语音信号段进行语段分割;以分割后的语段为单位进行语音质量评估,由于分割后的语段仅包含语音信号且比输入信号短,可以使用较低的成本,对较长的音频信号进行合理的语音质量监控,从而获得更精确的语音质量评估结果。

    根据频域能量对语音信号进行处理的方法和装置

    公开(公告)号:CN104934032A

    公开(公告)日:2015-09-23

    申请号:CN201410098869.4

    申请日:2014-03-17

    发明人: 许丽净

    摘要: 本发明实施例提供一种根据频域能量对语音信号进行处理的方法和装置。本发明的根据频域能量对语音信号进行处理的方法和装置包括:接收包括相邻的第一语音帧和第二语音帧的原始语音信号;分别对所述第一语音帧和所述第二语音帧进行傅里叶变换得到第一频域信号和第二频域信号,并得到所述第一语音帧和所述第二语音帧的频域能量分布;然后得到所述第一语音帧和所述第二语音帧的频域能量相关性系数;根据所述频域能量相关性系数对所述原始语音信号进行分段。本发明实施例可以解决在进行语音信号精细分段时,由于语音信号音素本身的特征或是较强噪声的影响,导致语音信号分段结果准确性不高的问题。

    音频信号分类处理方法、装置及设备

    公开(公告)号:CN104282315A

    公开(公告)日:2015-01-14

    申请号:CN201310274580.9

    申请日:2013-07-02

    发明人: 许丽净

    IPC分类号: G10L21/028

    CPC分类号: G10L25/81

    摘要: 本发明提供一种音频信号分类处理方法、装置及设备,其中方法包括:获取音频信号中待分类帧中满足连续性约束条件的音调分量的数量、所述音频信号中待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项;根据所述待分类帧中满足连续性约束条件的音调分量的数量、所述待分类帧在低频区域的持续帧数和所述待分类帧在高频区域的持续帧数中的至少一项,确定所述音频信号中待分类帧为音乐信号,或确定所述音频信号中待分类帧为语音信号。本发明提供的技术方案,能够提高音频信号的分类正确率。