人体非程式化运动的情感识别方法

    公开(公告)号:CN101561881B

    公开(公告)日:2012-07-04

    申请号:CN200910062131.1

    申请日:2009-05-19

    IPC分类号: G06K9/66 G06T7/20

    摘要: 人体非程式化运动的情感识别方法,属于计算机模式识别领域,解决现有同类情感识别方法存在的学习速度较慢、识别率偏低的问题。本发明包括建立隐马尔可夫模型步骤和情感识别步骤;建立隐马尔可夫模型步骤又包括训练数据采集子步骤、运动分割子步骤、特征提取子步骤、训练子步骤,建立多种动作类型各种情感的隐马尔可夫模型;情感识别步骤包括数据采集子步骤、运动分割子步骤、特征提取子步骤、识别子步骤,通过所构建的隐马尔可夫模型对待识别人体运动序列进行情感识别和动作类型识别。本发明能更好地展现运动的内在的规律,不仅可以识别情感,还可以识别运动类型,具有较高的识别率,具有较强的实用性和较广泛的用途。

    空间颜色直方图相似度度量方法

    公开(公告)号:CN101625763A

    公开(公告)日:2010-01-13

    申请号:CN200910061701.5

    申请日:2009-04-17

    IPC分类号: G06T7/20 G06T7/40

    摘要: 空间颜色直方图相似度度量方法,属于数字图像处理与分析方法,针对现有度量方法不够准确的问题,进一步提高图像相似度计算的准确性。本发明包括:一、计算像素量比例相似度步骤;二、计算像素位置信息相似度步骤;三、度量空间颜色直方图相似度步骤,按步骤一~二,遍历两个空间颜色直方图s和s′中所有三维立体方块,得到两个空间颜色直方图的相似度。本发明将空间颜色直方图每个三维立体方块内的像素分布近似为高斯分布,其概率密度函数的函数空间构成李群空间,在此基础上提出像素位置信息相似度,结合像素量比例相似度,归纳为本发明的度量方法,比现有方法在跟踪算法中有更好的跟踪效果。

    一种基于高斯混合模型的图像检索方法

    公开(公告)号:CN101620638B

    公开(公告)日:2011-09-14

    申请号:CN200910305324.5

    申请日:2009-08-06

    IPC分类号: G06F17/30

    摘要: 一种基于高斯混合模型的图像检索方法,属于图像检索领域,克服现有高斯混合模型距离度量方法准确性不够的问题,进一步提高高斯混合模型距离度量在人类感知上的准确度,从而提高图像检索性能。本发明包括:步骤一.提取图像库中所有图像对应的高斯混合模型;步骤二.提取待检索图像的高斯混合模型;步骤三.计算待检索图像的高斯混合模型与图像库中所有图像的高斯混合模型间的距离;步骤四.距离排序并返回检索结果。本发明提高了高斯混合模型距离度量的准确性,从而提高图像检索的性能。

    一种数字音乐情感的识别方法

    公开(公告)号:CN101599271B

    公开(公告)日:2011-09-14

    申请号:CN200910063035.9

    申请日:2009-07-07

    IPC分类号: G10L15/00 G06K9/62

    摘要: 一种数字音乐情感的识别方法,属于计算机模式识别领域,解决现有数字音乐情感识别方法不能针对基于采样的数字音乐格式进行识别的问题,采用基于多类支持向量机分类技术,结合声学特征参数与音乐乐理特征参数,进行数字音乐的情感识别。本发明包括:(1)预处理步骤;(2)特征提取步骤;(3)多类支持向量机训练步骤;(4)识别步骤。本发明将音乐情感分类为:高兴、激动、悲伤、放松四种,针对基于采样的数字音乐格式文件进行情感识别,不仅提取了语音识别领域常见的声学特征,还根据音乐的理论特点,提取了一系列的音乐乐理特征;同时采用了基于支持向量机的分类方法,学习速度快,分类精确率高,提高了识别效率。

    一种基于李群论的多模态情感识别方法

    公开(公告)号:CN102968643A

    公开(公告)日:2013-03-13

    申请号:CN201210466293.3

    申请日:2012-11-16

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种基于李群论的多模态情感识别方法,包括以下步骤:获取视频,并提取视频帧中图像区域的高斯型特征描述子,基于高斯型特征描述子对视频中的图像区域进行跟踪,根据视频子序列构建ARMA模型获取ARMA模型间的距离,根据ARMA模型之间的距离构建核函数,并进行情感表达分类,根据人体、脸部和手部的情感类别概率对人进行情感识别。本发明根据视频中所包含的人体姿态运动信息、手势和脸部表情信息来判断人的情感状态,是一个将视频数据映射到人体运动特征、手势特征和脸部表情特征,再从人体运动特征空间和脸部表情特征映射到状态空间的过程,并提出利用李群论进行多模态情感识别,提高模型进行情感识别的精确性。

    基于视觉特征的单音节语言唇读识别系统

    公开(公告)号:CN101101752B

    公开(公告)日:2010-12-01

    申请号:CN200710052795.0

    申请日:2007-07-19

    IPC分类号: G10L15/24 G06K9/00

    摘要: 基于视觉特征的单音节语言唇读识别系统,属于计算机智能识别技术,根据视频中人物说话时的唇动变化,识别说话内容,目的在于仅利用视频信息,解决如汉语等单音节语言的唇读识别问题。本发明包括视频解码模块、唇部定位模块、唇动分割模块、特征提取模块、语料库、模型建立模块和唇语识别模块;本发明所采用的语料库内容丰富,易于扩充,本发明只需处理视频图像,不需要音频数据进行辅助识别,能够对avi、wmv、rmvb、mpg等视频文件进行处理,满足无声条件下说话内容识别的要求。本发明的唇动分割部分以单音节为识别目标进行机器智能分割,与定长时间分割和手工分割相比,实用性更强,识别准确率得到极大提高。

    一种基于高斯混合模型的图像检索方法

    公开(公告)号:CN101620638A

    公开(公告)日:2010-01-06

    申请号:CN200910305324.5

    申请日:2009-08-06

    IPC分类号: G06F17/30

    摘要: 一种基于高斯混合模型的图像检索方法,属于图像检索领域,克服现有高斯混合模型距离度量方法准确性不够的问题,进一步提高高斯混合模型距离度量在人类感知上的准确度,从而提高图像检索性能。本发明包括:步骤一、提取图像库中所有图像对应的高斯混合模型;步骤二、提取待检索图像的高斯混合模型;步骤三、计算待检索图像的高斯混合模型与图像库中所有图像的高斯混合模型间的距离;步骤四、距离排序并返回检索结果。本发明提高了高斯混合模型距离度量的准确性,从而提高图像检索的性能。

    一种数字音乐情感的识别方法

    公开(公告)号:CN101599271A

    公开(公告)日:2009-12-09

    申请号:CN200910063035.9

    申请日:2009-07-07

    IPC分类号: G10L15/00 G06K9/62

    摘要: 一种数字音乐情感的识别方法,属于计算机模式识别领域,解决现有数字音乐情感识别方法不能针对基于采样的数字音乐格式进行识别的问题,采用基于多类支持向量机分类技术,结合声学特征参数与音乐乐理特征参数,进行数字音乐的情感识别。本发明包括:(1)预处理步骤;(2)特征提取步骤;(3)多类支持向量机训练步骤;(4)识别步骤。本发明将音乐情感分类为:高兴、激动、悲伤、放松四种,针对基于采样的数字音乐格式文件进行情感识别,不仅提取了语音识别领域常见的声学特征,还根据音乐的理论特点,提取了一系列的音乐乐理特征;同时采用了基于支持向量机的分类方法,学习速度快,分类精确率高,提高了识别效率。

    一种基于李群论的多模态情感识别方法

    公开(公告)号:CN102968643B

    公开(公告)日:2016-02-24

    申请号:CN201210466293.3

    申请日:2012-11-16

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种基于李群论的多模态情感识别方法,包括以下步骤:获取视频,并提取视频帧中图像区域的高斯型特征描述子,基于高斯型特征描述子对视频中的图像区域进行跟踪,根据视频子序列构建ARMA模型获取ARMA模型间的距离,根据ARMA模型之间的距离构建核函数,并进行情感表达分类,根据人体、脸部和手部的情感类别概率对人进行情感识别。本发明根据视频中所包含的人体姿态运动信息、手势和脸部表情信息来判断人的情感状态,是一个将视频数据映射到人体运动特征、手势特征和脸部表情特征,再从人体运动特征空间和脸部表情特征映射到状态空间的过程,并提出利用李群论进行多模态情感识别,提高模型进行情感识别的精确性。

    一种基于分层高斯混合模型的场景识别方法

    公开(公告)号:CN102968620B

    公开(公告)日:2015-05-20

    申请号:CN201210464352.3

    申请日:2012-11-16

    IPC分类号: G06K9/00 G06K9/66

    摘要: 本发明公开了一种基于分层高斯混合模型的场景识别方法,包括以下步骤:提取训练图像库中所有图像对应的分层高斯混合模型,并获取分层高斯混合模型的李代数描述子,接收待分类图像,并提取待分类图像的分层高斯混合模型的李代数描述子,用鉴别投影嵌入方法获取待分类图像的分层混合高斯的李代数描述子和训练图像库中所有图像的分层混合高斯的李代数描述子之间的距离,根据得到的距离利用最小中值距离分类器对待分类的图像进行分类,并返回分类结果。本发明优化了图像的分层高斯混合模型的特征表示,从而大大提高了场景识别的性能。