基于情感对特征优化的语音情感分类方法

    公开(公告)号:CN101894550A

    公开(公告)日:2010-11-24

    申请号:CN201010230514.8

    申请日:2010-07-19

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于情感对特征优化的语音情感分类方法,包括如下步骤:(1)采集喜、怒、惊、悲,和平静五种基本情感状态的语音数据;(2)语音情感特征提取;(3)情感对的配对;(4)特征压缩与特征选择:(4-1)线性判别分析(LDA)降维;使用每个情感对各自的投影向量,分别进行各自的LDA变换;(4-2)基于fisher判别准则的特征选择方法;(5)基于两类分类器组的判决融合:(5-1)记输入的情感语音数据(5-2)两类分类器的判决输出Ci,j;(5-3)每个两类分类器的置信度wi,j,用式(3)来得到:(5-4)用相关译码的方法来进行判决:最大的相关值对应的情感类别,即为识别结果。

    基于JND和AR模型的感知视频压缩方法

    公开(公告)号:CN101841723A

    公开(公告)日:2010-09-22

    申请号:CN201010182160.4

    申请日:2010-05-25

    Applicant: 东南大学

    Abstract: 本发明公布了一种基于可观测的衰减(Just Noticeable Distortion,JND)和自回归(Auto-regressive,AR)模型的感知视频压缩方法,包括了纹理区域的分割算法和基于自回归模型的合成算法。我们首先用基于JND的分割算法将视频中的纹理区域分割出来,接着用自回归模型合成纹理区域。本发明提出了空时JND模型,准确有效地进行了纹理区域的分割。设计了AR模型,通过简单计算,在保证视频质量的同时,大大提高了实时性。开发了结合人眼视觉特性的视频压缩技术,进一步提高了视频的压缩效率,减少了比特率。

    一种语音情感维度区域的自动识别方法

    公开(公告)号:CN105609116B

    公开(公告)日:2019-03-05

    申请号:CN201510976875.X

    申请日:2015-12-23

    Applicant: 东南大学

    Abstract: 本发明公开了一种语音情感维度区域的自动识别方法,属于语音识别技术领域。我们采用了一种特征空间重构的方法进行分类器的优化。第一,我们提取和优化基本声学特征作为区分情感区域的基准;第二,我们采用特征空间重构的方法将多个情感特征空间分解和配对,分别采用LDA和PCA模块级联的方法,提高目标类之间的离散程度;第三,我们提出两种情感区域的分割方法,即四个区域和十六个区域的分割方法,进行复合情感的分解,取代传统的基本情感类型,通过相关计算来融合分类器输出,进行情感区域的识别,获得了更高的识别效果。

    一种基于深度递归型条件受限玻尔兹曼机的测谎方法

    公开(公告)号:CN108175426A

    公开(公告)日:2018-06-19

    申请号:CN201711315604.5

    申请日:2017-12-11

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度递归型条件受限玻尔兹曼机的测谎方法,首先在连续语音段落中,利用条件受限玻尔兹曼机对时间序列具有良好的建模特性和简易的推理过程,对训练样本进行建模,得到说话人是否说谎的高阶统计信息;接着用该高阶统计信息和训练样本的标签对递归神经网络进行有监督的参数训练。在获得条件受限玻尔兹曼机和递归神经网络的初始化参数后,将这两个基本网络单元由下至上搭建而成;并在验证数据集上,基于最小二乘回归微调递归神经网络的参数;利用建立的网络,对说话人的语音信号特征进行测试。本发明能够自动得到测谎的结果,且具有相对较高的识别率,该方法对评测者的专业知识和技能要求不高,有较高的测试效率。

    一种语音情感维度区域的自动识别方法

    公开(公告)号:CN105609116A

    公开(公告)日:2016-05-25

    申请号:CN201510976875.X

    申请日:2015-12-23

    Applicant: 东南大学

    CPC classification number: G10L25/63 G10L15/08 G10L25/15 G10L25/24

    Abstract: 本发明公开了一种语音情感维度区域的自动识别方法,属于语音识别技术领域。我们采用了一种特征空间重构的方法进行分类器的优化。第一,我们提取和优化基本声学特征作为区分情感区域的基准;第二,我们采用特征空间重构的方法将多个情感特征空间分解和配对,分别采用LDA和PCA模块级联的方法,提高目标类之间的离散程度;第三,我们提出两种情感区域的分割方法,即四个区域和十六个区域的分割方法,进行复合情感的分解,取代传统的基本情感类型,通过相关计算来融合分类器输出,进行情感区域的识别,获得了更高的识别效果。

    一种基于伪说话人聚类的语音情感特征规整化方法

    公开(公告)号:CN103531198B

    公开(公告)日:2016-03-23

    申请号:CN201310534319.8

    申请日:2013-11-01

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于伪说话人聚类的语音情感特征规整化方法,适合应用于非特定说话人情感识别。本发明首先提取出能够反映说话人信息的特征空间;接着在此特征空间内进行模糊聚类,自动获得情感语料中的说话人的身份信息,据此信息进行“伪说话人”分组,每一条样本按照其相似程度划分到不同的伪说话人分组中;而后根据每条样本的伪说话人组别信息,进行情感特征的规整化;最终在规整化后的数据中加入相应组别的模糊隶属度信息。通过上述处理过程,使得情感特征空间中的样本分布更加清晰有效,降低了大量说话人带来的特征差异,增强了说话人鲁棒性。

    一种认知无线电功率控制方法

    公开(公告)号:CN102497643A

    公开(公告)日:2012-06-13

    申请号:CN201110415016.5

    申请日:2011-12-13

    Applicant: 东南大学

    Abstract: 本发明公开了一种认知无线电功率控制方法是以D.Goodman提出的非合作博弈功率控制算法为基础,对收益函数进行改进,提供一种新的基于非合作博弈功率控制算法,同时为了提高所提功控算法的搜索精度,本发明又提出一种改进的混合蛙跳算法。本发明的认知无线电功率控制方法计算精度更高,实现对用户发射功率的有效控制,能明显提升系统性能。

    一种针对烦躁情绪的可据判的自动语音情感识别方法

    公开(公告)号:CN101937678A

    公开(公告)日:2011-01-05

    申请号:CN201010230511.4

    申请日:2010-07-19

    Applicant: 东南大学

    Abstract: 本发明公布了一种针对烦躁情绪的可据判的自动语音情感识别方法,包括如下步骤:(1)建立烦躁语音数据库;(2)提取语音情感特征;(3)特征选择:采用fisher准则进行特征评价;(4)可据判的识别方法:(4-1)采用GMM对烦躁、喜悦和平静三种情感进行建模,每种情感对应一个GMM模型,通过最大后验概率准则判决;(4-2)采用一种基于似然概率模糊熵的拒判方法对样本与情感类别之间的符合程度进行度量,从而实现对未知类别样本的拒判。本发明具有较好的烦躁情绪的识别性能。

Patent Agency Ranking