一种基于基音周期和MFCC的融合特征参数提取方法

    公开(公告)号:CN106782500A

    公开(公告)日:2017-05-31

    申请号:CN201611215760.X

    申请日:2016-12-23

    CPC classification number: G10L15/02 G10L15/06 G10L15/10 G10L2015/0631

    Abstract: 本发明提出了一种融合基音周期和Mel倒谱参数的融合特征参数PITCHMFCC。通过增加Mel倒谱参数的维度来提高声纹识别效率的方法。基音周期是基于人体发声结构提出,而Mel倒谱参数通过人耳听觉结构提出,结合这两种特征得到的混合特征参数更符合人体生理结构。方法是通过每一帧语音数据获得该帧语音的Mel倒谱参数,Mel倒谱参数的一阶差分参数,二阶差分参数以及该帧的说话人基音周期参数。将这四个参数结合成一个(3L+1)维的特征矢量。这样更逼近语音的动态特征和人体的生理结构,可以提高声纹识别的效率。

    一种基于信息熵的超高维数据降维算法

    公开(公告)号:CN106407363A

    公开(公告)日:2017-02-15

    申请号:CN201610810509.1

    申请日:2016-09-08

    CPC classification number: G06F16/283

    Abstract: 本发明提出了一种基于信息熵的高维数据降维算法。属于高维数据预处理领域。本发明旨在解决传统PCA算法在实际的应用中存在的问:当数据维数(特征)足够高的时候,无法将所有数据特征读一次性入内存以进行分析计算,实验在不借助云平台、分布式计算平台的情况下,使用了分块处理的方法,但是此方法处理耗时太长,不能满足实际应用需求。在此基础上,引入信息熵的思想,对PCA算法进行了改进,使得改进后的算法能够用于处理超高维数据降维,实验结果表明在保证保留相同比例原始数据信息的情况下,后者运行耗时相较于分块处理算法缩减了60倍。

Patent Agency Ranking