发明公开
- 专利标题: 一种面向开放环境的多模态人像表情识别方法及装置
-
申请号: CN202410230845.3申请日: 2024-02-29
-
公开(公告)号: CN118196854A公开(公告)日: 2024-06-14
- 发明人: 李亚利 , 张济川 , 王生进
- 申请人: 清华大学
- 申请人地址: 北京市海淀区双清路30号清华大学清华园北京100084-82信箱
- 专利权人: 清华大学
- 当前专利权人: 清华大学
- 当前专利权人地址: 北京市海淀区双清路30号清华大学清华园北京100084-82信箱
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 杨小庆
- 主分类号: G06V40/16
- IPC分类号: G06V40/16 ; G06N3/0464 ; G06N3/08
摘要:
本发明提供一种面向开放环境的多模态人像表情识别方法及装置。该方法包括:获取待分析的开放环境中的人脸图像;从预设的表情开放文本池获取表情描述文本;将人脸图像和表情描述文本分别输入到多模态表情识别模型中,获得多模态表情识别模型分别输出的人像特征表征向量和文本特征表征向量;其中,多模态表情识别模型是基于非合作条件下获取的样本人脸图像及其对应的样本表情描述文本进行训练得到的;对人像特征表征向量和文本特征表征向量进行相似度分析,获得相似度结果;基于相似度结果确定人脸图像对应的表情识别结果。本发明提供的面向开放环境的多模态人像表情识别方法,能够有效提高开放环境条件下的人像表情识别精度和细粒度。