-
公开(公告)号:CN108694949B
公开(公告)日:2021-06-22
申请号:CN201810257464.9
申请日:2018-03-27
申请人: 佛山市顺德区中山大学研究院 , 广东顺德中山大学卡内基梅隆大学国际联合研究院 , 中山大学
摘要: 本发明公开了基于重排序超向量和残差网络的说话人识别方法及其装置,方法包括:对语音样本进行信号检测,提取及优化MFCC特征;基于TDNN声学模型处理MFCC特征,得到均值中心化超向量;根据senone状态的相似性对均值中心化超向量进行重排序;以重排序后的均值中心化超向量作为外部神经网络的输入,对外部神经网络进行训练,其中输入端为残差网络,从其输出端获取说话人的深度编码特征;对说话人的深度编码特征进行PLDA建模,得到PLDA模型;计算语音样本的深度编码特征在PLDA模型上的似然得分,判断说话人是否为同一个人。本发明能够更好地学习超向量内部的连续性信息和局部相关性信息,有利于提升说话人识别性能。
-
公开(公告)号:CN108694949A
公开(公告)日:2018-10-23
申请号:CN201810257464.9
申请日:2018-03-27
申请人: 佛山市顺德区中山大学研究院 , 广东顺德中山大学卡内基梅隆大学国际联合研究院 , 中山大学
摘要: 本发明公开了基于重排序超向量和残差网络的说话人识别方法及其装置,方法包括:对语音样本进行信号检测,提取及优化MFCC特征;基于TDNN声学模型处理MFCC特征,得到均值中心化超向量;根据senone状态的相似性对均值中心化超向量进行重排序;以重排序后的均值中心化超向量作为外部神经网络的输入,对外部神经网络进行训练,其中输入端为残差网络,从其输出端获取说话人的深度编码特征;对说话人的深度编码特征进行PLDA建模,得到PLDA模型;计算语音样本的深度编码特征在PLDA模型上的似然得分,判断说话人是否为同一个人。本发明能够更好地学习超向量内部的连续性信息和局部相关性信息,有利于提升说话人识别性能。
-
公开(公告)号:CN106601258A
公开(公告)日:2017-04-26
申请号:CN201611139153.X
申请日:2016-12-12
申请人: 广东顺德中山大学卡内基梅隆大学国际联合研究院 , 中山大学
摘要: 本发明提供的说话人识别方法引入改进的LSDA算法代替之前的LDA算法来进行信道补偿,改进的LSDA算法通过引入自适应k近邻的概念,跟据每个类的大小自适应地寻找k个类内近邻与βk个类间近邻;并且引入每一说话人类对算法贡献均等的概念,对每一说话人类在目标方程中的贡献进行归一化处理。使得方法更适用于说话人识别任务的数据分布,从而在说话人识别准确率上得到比原始LSDA算法更好的性能提升。
-
公开(公告)号:CN105069304B
公开(公告)日:2019-04-05
申请号:CN201510507634.0
申请日:2015-08-18
摘要: 本发明公开一种基于机器学习的评估预测ASD的装置,包括:采集模块,用于采用眼动仪分别采集参与的实验人员观看人脸图片时眼球扫描人脸的眼动数据,所述参与的实验人员包括患有ASD个体与正常个体;划分模块,用于将人脸图片划分成不同区域;提取模块,用于从眼动仪采集的原始数据中提取特征并标记;训练分类模块,用于利用已标记的特征训练分类器,得到预测ASD的眼动分类器模型;预测模块,用于采用由训练分类模块获取的预测ASD的分类器模型对测试者进行测试,对测试者的孤独症进行评估预测。本发明能被视作一个ASD评估的辅助装置,使得早期的ASD评估预测更加准确与方便。
-
公开(公告)号:CN105069304A
公开(公告)日:2015-11-18
申请号:CN201510507634.0
申请日:2015-08-18
摘要: 本发明公开一种基于机器学习的评估预测ASD的方法,包括以下步骤:S1.采集数据:采用眼动仪分别采集参与的实验人员观看人脸图片时眼球扫描人脸的眼动数据,所述参与的实验人员包括患有ASD个体与正常个体;S2.提取特征:根据采集的眼动坐标数据将人脸图片分成不同的区域,并从眼动仪采集的原始数据中提取特征并标记;S3训练分类器:利用已标记的特征训练分类器,得到预测ASD分类器模型;S4.进行预测:采用由步骤S3获取预测ASD的分类器模型对测试者进行测试,对测试者的孤独症程度进行评估预测。本发明能被视作一个ASD评估的补充方法,使得早期的ASD评估预测更加准确与方便。
-
-
-
-