基于矢量量化的声纹识别方法及系统

    公开(公告)号:CN102509547A

    公开(公告)日:2012-06-20

    申请号:CN201110450364.6

    申请日:2011-12-29

    Abstract: 一种基于矢量量化的声纹识别方法及系统,具有良好识别性能和抗噪能力,识别效果比较好,建模数据少,判决速度快,而且复杂度不高。具体步骤如下:语音信号的采集;语音信号预处理;语音信号特征参数提取:采用MFCC参数,MFCC的阶数为12~16;模板训练:采用LBG聚类算法为系统中的每一个说话人建立一个码本存储在语音数据库中作为该说话人的语音模板;声纹辨识:通过将采集到的待识别语音信号特征参数与库中已建立的说话人语音模板进行比较,并根据加权欧式距离测度进行判断,若对应的说话人模板使得待识别的话者语音特征向量X具有最小平均距离测度,则认为识别出说话人。

    基于高斯混合模型的声纹识别方法及系统

    公开(公告)号:CN102324232A

    公开(公告)日:2012-01-18

    申请号:CN201110267690.3

    申请日:2011-09-12

    Abstract: 一种基于高斯混合模型的声纹识别方法及系统,步骤如下:语音信号采集;语音信号预处理;语音信号特征参数提取:采用梅尔频率倒谱系数(MFCC),MFCC的阶数通常取为12~16;模型训练:采用EM算法为说话人的语音信号特征参数训练高斯混合模型(GMM),模型的参数初始化方法选用k-means算法;声纹辨识:将采集到的待识别语音信号特征参数与已建立的说话人语音模型进行比较,并根据最大后验概法进行判断,若对应的说话人模型使得待识别的话者语音特征向量X具有最大的后验概率,则识别出说话人。该方法采用了基于概率统计的高斯混合模型,能很好的反映说话人的语音在特征空间的分布,其概率密度函数比较常见,模型中的参数易于估计和训练,而且具有良好识别性能和抗噪能力。

    基于矢量量化的声纹识别方法及系统

    公开(公告)号:CN102509547B

    公开(公告)日:2013-06-19

    申请号:CN201110450364.6

    申请日:2011-12-29

    Abstract: 一种基于矢量量化的声纹识别方法及系统,具有良好识别性能和抗噪能力,识别效果比较好,建模数据少,判决速度快,而且复杂度不高。具体步骤如下:语音信号的采集;语音信号预处理;语音信号特征参数提取:采用MFCC参数,MFCC的阶数为12~16;模板训练:采用LBG聚类算法为系统中的每一个说话人建立一个码本存储在语音数据库中作为该说话人的语音模板;声纹辨识:通过将采集到的待识别语音信号特征参数与库中已建立的说话人语音模板进行比较,并根据加权欧式距离测度进行判断,若对应的说话人模板使得待识别的话者语音特征向量X具有最小平均距离测度,则认为识别出说话人。

Patent Agency Ranking