一种面向开放环境的多模态人像表情识别方法及装置

发明公开

CN118196854A 一种面向开放环境的多模态人像表情识别方法及装置审中-实审

请登陆查看更多内容

专利标题： 一种面向开放环境的多模态人像表情识别方法及装置
申请号： CN202410230845.3

申请日： 2024-02-29
公开(公告)号： CN118196854A

公开(公告)日： 2024-06-14
发明人: 李亚利 , 张济川 , 王生进
申请人： 清华大学
申请人地址： 北京市海淀区双清路30号清华大学清华园北京100084-82信箱
专利权人： 清华大学
当前专利权人： 清华大学
当前专利权人地址： 北京市海淀区双清路30号清华大学清华园北京100084-82信箱
代理机构： 北京路浩知识产权代理有限公司
代理商 杨小庆
主分类号： G06V40/16
IPC分类号： G06V40/16 ; G06N3/0464 ; G06N3/08

摘要：

本发明提供一种面向开放环境的多模态人像表情识别方法及装置。该方法包括：获取待分析的开放环境中的人脸图像；从预设的表情开放文本池获取表情描述文本；将人脸图像和表情描述文本分别输入到多模态表情识别模型中，获得多模态表情识别模型分别输出的人像特征表征向量和文本特征表征向量；其中，多模态表情识别模型是基于非合作条件下获取的样本人脸图像及其对应的样本表情描述文本进行训练得到的；对人像特征表征向量和文本特征表征向量进行相似度分析，获得相似度结果；基于相似度结果确定人脸图像对应的表情识别结果。本发明提供的面向开放环境的多模态人像表情识别方法，能够有效提高开放环境条件下的人像表情识别精度和细粒度。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V40/00	识别图像或视频数据中的生物特征、人类相关或动物相关模式
G06V40/10	.人体或动物体，例如车辆乘员或行人；身体部位，例如手
G06V40/16	..人脸，例如面部部分、草图或表情