Invention Application
- Patent Title: 一种音频数据的自动增益控制方法与装置
- Patent Title (English): WO2018107874A1 - Method and apparatus for automatically controlling gain of audio data
-
Application No.: PCT/CN2017/104796Application Date: 2017-09-30
-
Publication No.: WO2018107874A1Publication Date: 2018-06-21
- Inventor: 雷延强 , 程雪峰
- Applicant: 广州视源电子科技股份有限公司
- Applicant Address: 中国广东省广州市黄埔区云埔四路6号, Guangdong 510530 CN
- Assignee: 广州视源电子科技股份有限公司
- Current Assignee: 广州视源电子科技股份有限公司
- Current Assignee Address: 中国广东省广州市黄埔区云埔四路6号, Guangdong 510530 CN
- Agency: 广州三环专利商标代理有限公司
- Priority: CN201611169178.4 20161216
- Main IPC: G10L21/0272
- IPC: G10L21/0272 ; G10L25/03 ; G10L25/51
Abstract:
一种音频数据自动增益控制方法与装置,该方法包括:对音频数据进行分帧处理,并提取各帧数据的特征参数(S1);根据当前帧数据的特征参数与语音类别高斯混合模型得到当前帧数据的语音类条件概率,以及根据当前帧数据的特征参数与预先配置的噪声类别高斯混合模型,得到当前帧数据的噪声类条件概率(S2);根据当前帧数据的语音类条件概率与当前帧的噪声类条件概率计算当前帧数据属于语音帧的概率以及属于噪声帧的概率(S3);当当前帧数据属于语音帧的概率大于属于噪声帧的概率时,将当前帧音频数据判定为语音帧,当当前帧数据属于语音帧的概率小于噪声帧的概率时,将当前帧数据判定为噪声帧(S4);当当前帧数据被判定为语音帧时,按照预先配置的语音帧增益控制规则控制其增益,当前帧数据被判定为噪声帧时,按照预先配置的噪声帧增益控制规则控制其增益(S5)。该方法能提高语音与噪声的识别水平,并依此进行自动增益控制,有效改善使用者的体验。
Information query