-
公开(公告)号:CN104156628B
公开(公告)日:2017-05-31
申请号:CN201410437529.X
申请日:2014-08-29
Applicant: 东南大学
Abstract: 本发明公开了一种基于多核学习判别分析的舰船辐射信号识别方法,对舰船辐射信号样本依次进行预处理、听觉模型特征提取、维数约简、分类器分类判决。其中在维数约简阶段,使用了基于多核学习判别分析的方法,利用交替优化,分别对核映射系数和线性多核组合系数,在用图嵌入形式表示的核判别分析优化目标下,进行优化运算。与现有方法相比,本发明的方法在舰船辐射信号的识别方面,能够有效地提升系统的识别性能。
-
公开(公告)号:CN103854645B
公开(公告)日:2016-08-24
申请号:CN201410078383.4
申请日:2014-03-05
Applicant: 东南大学
IPC: G10L15/08 , G10L21/003 , G10L25/63
Abstract: 本发明公开了一种基于说话人惩罚的独立于说话人语音情感识别方法,对语音信号样本依次进行预处理、语音情感原始特征提取、维数约简、分类器分类判决。其中在维数约简阶段,使用了基于说话人惩罚的图嵌入学习方法,利用说话人标签信息,分别针对属于同一类情感类别但说话人不同,以及属于同一说话人但分属于不同情感类别的语音信号样本对,在图嵌入理论的基础上利用已有理论,进行组合优化运算。与现有方法相比,本发明的方法在独立于说话人的语音情感识别中,能够有效地提升系统的识别性能。
-
公开(公告)号:CN103578481B
公开(公告)日:2016-04-27
申请号:CN201210256381.0
申请日:2012-07-24
Abstract: 本发明公开了一种跨语言的语音情感识别方法,属于语音信号处理领域。本方法首先建立了一个汉语语音库和德语语音库,然后对其中的语音进行特征提取,计算每个特征分别关于两个语音库的Fisher判别系数,并采用加权融合技术来获得每个特征的跨语言Fisher判别系数,并排序选出情感区分度最好的一些特征。在训练和识别中采用高斯混合模型来分别进行参数估计和似然值的计算。本发明可以有效地解决现有的语音情感识别方法只针对某种特定语言的局限性,所提出的基于加权融合的Fisher判别系数对于跨语言情感识别中的特征选择也具有很好的效果。
-
公开(公告)号:CN103578481A
公开(公告)日:2014-02-12
申请号:CN201210256381.0
申请日:2012-07-24
Abstract: 本发明公开了一种跨语言的语音情感识别方法,属于语音信号处理领域。本方法首先建立了一个汉语语音库和德语语音库,然后对其中的语音进行特征提取,计算每个特征分别关于两个语音库的Fisher判别系数,并采用加权融合技术来获得每个特征的跨语言Fisher判别系数,并排序选出情感区分度最好的一些特征。在训练和识别中采用高斯混合模型来分别进行参数估计和似然值的计算。本发明可以有效地解决现有的语音情感识别方法只针对某种特定语言的局限性,所提出的基于加权融合的Fisher判别系数对于跨语言情感识别中的特征选择也具有很好的效果。
-
公开(公告)号:CN102779510B
公开(公告)日:2013-12-18
申请号:CN201210250571.1
申请日:2012-07-19
Applicant: 东南大学
Abstract: 本发明公开了一种基于特征空间自适应投影的语音情感识别方法,属于语音信号处理领域。本发明首先对语音进行特征提取,并且计算每个特征的模糊熵,当该特征的模糊熵小于预先设定好的阈值时,则认为该特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征。在训练的参数迭代估计中对权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型;最后采用计算高斯混合模型似然值的方式进行识别。采用本发明的方法可以有效地去除对识别效果不佳的特征,从而提高语音情感识别率。
-
公开(公告)号:CN102779510A
公开(公告)日:2012-11-14
申请号:CN201210250571.1
申请日:2012-07-19
Applicant: 东南大学
Abstract: 本发明公开了一种基于特征空间自适应投影的语音情感识别方法,属于语音信号处理领域。本发明首先对语音进行特征提取,并且计算每个特征的模糊熵,当该特征的模糊熵小于预先设定好的阈值时,则认为该特征与一般模型的差异较大,应该进行投影压缩,即在特征矢量中删除此特征。在训练的参数迭代估计中对权重进行强化,从而训练出对于每一类情感所对应的高斯混合模型;最后采用计算高斯混合模型似然值的方式进行识别。采用本发明的方法可以有效地去除对识别效果不佳的特征,从而提高语音情感识别率。
-
公开(公告)号:CN102737643A
公开(公告)日:2012-10-17
申请号:CN201110092780.3
申请日:2011-04-14
Applicant: 东南大学
IPC: G10L21/02
Abstract: 本发明提供一种基于Gabor时频分析的耳语增强方法,包括如下步骤:第1步:利用Gabor时频分析理论和方法提取耳语音对数谱幅度,第2步,基于无语音概率的耳语音噪声谱估计,第3步,获取纯净耳语音的功率谱,并求增强后的耳语音信号;本发明基于Gabor变换下的耳语音功率谱根据抽样率的不同有着多样的时频分析细腻度,从而可以根据不同的语音类型采用不同的抽样率,使算法普适性更强。
-
公开(公告)号:CN107886942A
公开(公告)日:2018-04-06
申请号:CN201711055574.9
申请日:2017-10-31
Applicant: 东南大学
CPC classification number: G10L15/02 , G10L15/063 , G10L15/08 , G10L15/10 , G10L25/63 , G10L2015/0631
Abstract: 本发明公开了一种基于局部惩罚随机谱回归的语音信号情感识别方法,对带有情感信息的语段信号样本进行副语言特征提取、数据映射、局部惩罚嵌入图设计和图分解、回归、分类器分类判决。其中在数据映射阶段,使用了随机生成点进行非线性特征映射;在局部惩罚嵌入图设计和图分解阶段,使用了局部惩罚嵌入图,以加大对类间边缘样本对之间的惩罚权重,生成训练样本的虚拟坐标。与现有方法相比,本发明的方法在语音信号情感识别方面,能够有效地提升系统的识别性能。
-
公开(公告)号:CN104537386A
公开(公告)日:2015-04-22
申请号:CN201410677256.6
申请日:2014-11-21
Applicant: 东南大学
CPC classification number: G06T2207/20036
Abstract: 本发明公开了一种基于级联混合高斯形状模型的多姿态图像特征点配准方法。该方法针对任意一种图像特征点定位器的定位结果,本发明中的配准方法能够显著提高其定位精度。本发明中所述的配准方法主要包括以下步骤:一、在多姿态的图像数据库上进行混合高斯形状模型的建模;二、采用一种级联的混合高斯形状模型对特征点进行校准,在每一级中,遍历特征点可能组成的形状,通过计算该形状对应的似然概率的阈值来判断出错误定位的特征点;三、采用正确特征点的高斯分布条件概率进行错误特征点的纠错。
-
-
-
-
-
-
-
-