一种音频数据的自动增益控制方法与装置

Invention Application

WO2018107874A1 一种音频数据的自动增益控制方法与装置审中-公开

Please log in to see more content

Patent Title: 一种音频数据的自动增益控制方法与装置
Patent Title (English): WO2018107874A1 - Method and apparatus for automatically controlling gain of audio data
Application No.: PCT/CN2017/104796

Application Date: 2017-09-30
Publication No.: WO2018107874A1

Publication Date: 2018-06-21
Inventor: 雷延强 , 程雪峰
Applicant: 广州视源电子科技股份有限公司
Applicant Address: 中国广东省广州市黄埔区云埔四路6号, Guangdong 510530 CN
Assignee: 广州视源电子科技股份有限公司
Current Assignee: 广州视源电子科技股份有限公司
Current Assignee Address: 中国广东省广州市黄埔区云埔四路6号, Guangdong 510530 CN
Agency: 广州三环专利商标代理有限公司
Priority: CN201611169178.4 20161216
Main IPC: G10L21/0272
IPC: G10L21/0272 ; G10L25/03 ; G10L25/51

Abstract:

一种音频数据自动增益控制方法与装置，该方法包括：对音频数据进行分帧处理，并提取各帧数据的特征参数（S1）；根据当前帧数据的特征参数与语音类别高斯混合模型得到当前帧数据的语音类条件概率，以及根据当前帧数据的特征参数与预先配置的噪声类别高斯混合模型，得到当前帧数据的噪声类条件概率（S2）；根据当前帧数据的语音类条件概率与当前帧的噪声类条件概率计算当前帧数据属于语音帧的概率以及属于噪声帧的概率（S3）；当当前帧数据属于语音帧的概率大于属于噪声帧的概率时，将当前帧音频数据判定为语音帧，当当前帧数据属于语音帧的概率小于噪声帧的概率时，将当前帧数据判定为噪声帧（S4）；当当前帧数据被判定为语音帧时，按照预先配置的语音帧增益控制规则控制其增益，当前帧数据被判定为噪声帧时，按照预先配置的噪声帧增益控制规则控制其增益（S5）。该方法能提高语音与噪声的识别水平，并依此进行自动增益控制，有效改善使用者的体验。

Information query

Global Dossier Patent Scope Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L21/00	为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L19/00优先）
G10L21/02	.语音增强，例如降低噪声或消除回声（在直线传送系统中减轻回声效应入H04B3/20；免提电话中的回声抑制入H04M9/08）
G10L21/0272	..声音信号的分离