-
公开(公告)号:CN103578481B
公开(公告)日:2016-04-27
申请号:CN201210256381.0
申请日:2012-07-24
Abstract: 本发明公开了一种跨语言的语音情感识别方法,属于语音信号处理领域。本方法首先建立了一个汉语语音库和德语语音库,然后对其中的语音进行特征提取,计算每个特征分别关于两个语音库的Fisher判别系数,并采用加权融合技术来获得每个特征的跨语言Fisher判别系数,并排序选出情感区分度最好的一些特征。在训练和识别中采用高斯混合模型来分别进行参数估计和似然值的计算。本发明可以有效地解决现有的语音情感识别方法只针对某种特定语言的局限性,所提出的基于加权融合的Fisher判别系数对于跨语言情感识别中的特征选择也具有很好的效果。
-
公开(公告)号:CN103578481A
公开(公告)日:2014-02-12
申请号:CN201210256381.0
申请日:2012-07-24
Abstract: 本发明公开了一种跨语言的语音情感识别方法,属于语音信号处理领域。本方法首先建立了一个汉语语音库和德语语音库,然后对其中的语音进行特征提取,计算每个特征分别关于两个语音库的Fisher判别系数,并采用加权融合技术来获得每个特征的跨语言Fisher判别系数,并排序选出情感区分度最好的一些特征。在训练和识别中采用高斯混合模型来分别进行参数估计和似然值的计算。本发明可以有效地解决现有的语音情感识别方法只针对某种特定语言的局限性,所提出的基于加权融合的Fisher判别系数对于跨语言情感识别中的特征选择也具有很好的效果。
-
公开(公告)号:CN103578480B
公开(公告)日:2016-04-27
申请号:CN201210256326.1
申请日:2012-07-24
Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。
-
公开(公告)号:CN103578480A
公开(公告)日:2014-02-12
申请号:CN201210256326.1
申请日:2012-07-24
Abstract: 本发明公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。
-
公开(公告)号:CN105609116B
公开(公告)日:2019-03-05
申请号:CN201510976875.X
申请日:2015-12-23
Applicant: 东南大学
Abstract: 本发明公开了一种语音情感维度区域的自动识别方法,属于语音识别技术领域。我们采用了一种特征空间重构的方法进行分类器的优化。第一,我们提取和优化基本声学特征作为区分情感区域的基准;第二,我们采用特征空间重构的方法将多个情感特征空间分解和配对,分别采用LDA和PCA模块级联的方法,提高目标类之间的离散程度;第三,我们提出两种情感区域的分割方法,即四个区域和十六个区域的分割方法,进行复合情感的分解,取代传统的基本情感类型,通过相关计算来融合分类器输出,进行情感区域的识别,获得了更高的识别效果。
-
公开(公告)号:CN108175426A
公开(公告)日:2018-06-19
申请号:CN201711315604.5
申请日:2017-12-11
Applicant: 东南大学
IPC: A61B5/16
Abstract: 本发明公开了一种基于深度递归型条件受限玻尔兹曼机的测谎方法,首先在连续语音段落中,利用条件受限玻尔兹曼机对时间序列具有良好的建模特性和简易的推理过程,对训练样本进行建模,得到说话人是否说谎的高阶统计信息;接着用该高阶统计信息和训练样本的标签对递归神经网络进行有监督的参数训练。在获得条件受限玻尔兹曼机和递归神经网络的初始化参数后,将这两个基本网络单元由下至上搭建而成;并在验证数据集上,基于最小二乘回归微调递归神经网络的参数;利用建立的网络,对说话人的语音信号特征进行测试。本发明能够自动得到测谎的结果,且具有相对较高的识别率,该方法对评测者的专业知识和技能要求不高,有较高的测试效率。
-
公开(公告)号:CN105609116A
公开(公告)日:2016-05-25
申请号:CN201510976875.X
申请日:2015-12-23
Applicant: 东南大学
Abstract: 本发明公开了一种语音情感维度区域的自动识别方法,属于语音识别技术领域。我们采用了一种特征空间重构的方法进行分类器的优化。第一,我们提取和优化基本声学特征作为区分情感区域的基准;第二,我们采用特征空间重构的方法将多个情感特征空间分解和配对,分别采用LDA和PCA模块级联的方法,提高目标类之间的离散程度;第三,我们提出两种情感区域的分割方法,即四个区域和十六个区域的分割方法,进行复合情感的分解,取代传统的基本情感类型,通过相关计算来融合分类器输出,进行情感区域的识别,获得了更高的识别效果。
-
公开(公告)号:CN103531198B
公开(公告)日:2016-03-23
申请号:CN201310534319.8
申请日:2013-11-01
Applicant: 东南大学
Abstract: 本发明公开了一种基于伪说话人聚类的语音情感特征规整化方法,适合应用于非特定说话人情感识别。本发明首先提取出能够反映说话人信息的特征空间;接着在此特征空间内进行模糊聚类,自动获得情感语料中的说话人的身份信息,据此信息进行“伪说话人”分组,每一条样本按照其相似程度划分到不同的伪说话人分组中;而后根据每条样本的伪说话人组别信息,进行情感特征的规整化;最终在规整化后的数据中加入相应组别的模糊隶属度信息。通过上述处理过程,使得情感特征空间中的样本分布更加清晰有效,降低了大量说话人带来的特征差异,增强了说话人鲁棒性。
-
公开(公告)号:CN101937678A
公开(公告)日:2011-01-05
申请号:CN201010230511.4
申请日:2010-07-19
Applicant: 东南大学
Abstract: 本发明公布了一种针对烦躁情绪的可据判的自动语音情感识别方法,包括如下步骤:(1)建立烦躁语音数据库;(2)提取语音情感特征;(3)特征选择:采用fisher准则进行特征评价;(4)可据判的识别方法:(4-1)采用GMM对烦躁、喜悦和平静三种情感进行建模,每种情感对应一个GMM模型,通过最大后验概率准则判决;(4-2)采用一种基于似然概率模糊熵的拒判方法对样本与情感类别之间的符合程度进行度量,从而实现对未知类别样本的拒判。本发明具有较好的烦躁情绪的识别性能。
-
公开(公告)号:CN107886942A
公开(公告)日:2018-04-06
申请号:CN201711055574.9
申请日:2017-10-31
Applicant: 东南大学
CPC classification number: G10L15/02 , G10L15/063 , G10L15/08 , G10L15/10 , G10L25/63 , G10L2015/0631
Abstract: 本发明公开了一种基于局部惩罚随机谱回归的语音信号情感识别方法,对带有情感信息的语段信号样本进行副语言特征提取、数据映射、局部惩罚嵌入图设计和图分解、回归、分类器分类判决。其中在数据映射阶段,使用了随机生成点进行非线性特征映射;在局部惩罚嵌入图设计和图分解阶段,使用了局部惩罚嵌入图,以加大对类间边缘样本对之间的惩罚权重,生成训练样本的虚拟坐标。与现有方法相比,本发明的方法在语音信号情感识别方面,能够有效地提升系统的识别性能。
-
-
-
-
-
-
-
-
-