一种基于多模态识别视频情感信息的方法

发明公开

CN112733764A 一种基于多模态识别视频情感信息的方法无效 - 撤回

请登陆查看更多内容

专利标题： 一种基于多模态识别视频情感信息的方法
申请号： CN202110056309.2

申请日： 2021-01-15
公开(公告)号： CN112733764A

公开(公告)日： 2021-04-30
发明人: 聂为之 , 任敏捷 , 刘安安 , 张勇东
申请人： 天津大学
申请人地址： 天津市南开区卫津路92号
专利权人： 天津大学
当前专利权人： 天津大学
当前专利权人地址： 天津市南开区卫津路92号
代理机构： 天津市北洋有限责任专利代理事务所
代理商 李林娟
主分类号： G06K9/00
IPC分类号： G06K9/00 ; G06K9/62

摘要：

本发明公开了一种基于多模态识别视频情感信息的方法，包括：根据所得每个视频的语音信号和关键帧分别提取特征；对所得的语音特征和关键帧特征进行融合得到每个视频特征描述符；根据视频特征描述符建立关系图；根据关系图，通过多头注意力构造多个全连接图，生成多分支图卷积网络；对构造的每个全连接图，即为多分支图卷积网络中的每个分支，分别作图卷积更新节点特征；将多个全连接图的更新后的节点特征进行融合，生成唯一的节点特征即最终所得的包含视频间关联性的视频特征描述符；对最终的视频特征描述符进行分类得到每个视频所属的情感类别。本发明利用视频描述符之间的相关性提升音频视频情感识别任务的分类精度。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06K	图形数据读取（图像或视频识别或理解G06V）；数据的呈现；记录载体；处理记录载体
G06K9/00	识别模式的方法或装置（图形读取或将机械参数模式（例如力或存在）转换为电信号的方法或装置 G06K11/00）（图像或视频识别或理解 G06V）（语音识别 G10L15/00 )