一种人工智能视频问答方法

发明公开

CN112036276A 一种人工智能视频问答方法有权

请登陆查看更多内容

专利标题： 一种人工智能视频问答方法
申请号： CN202010839563.5

申请日： 2020-08-19
公开(公告)号： CN112036276A

公开(公告)日： 2020-12-04
发明人: 王田 , 李嘉锟 , 李泽贤 , 张奇鹏 , 彭泰膺 , 吕金虎
申请人： 北京航空航天大学
申请人地址： 北京市海淀区学院路37号
专利权人： 北京航空航天大学
当前专利权人： 北京航空航天大学
当前专利权人地址： 北京市海淀区学院路37号
代理机构： 北京康思博达知识产权代理事务所
代理商 范国锋; 刘冬梅
主分类号： G06K9/00
IPC分类号： G06K9/00 ; G06K9/62 ; G06F40/30

摘要：

本发明公开了一种人工智能视频问答方法，包括以下步骤：S1、获取视觉特征和文字特征；S2、视觉特征提取，对视觉特征和语义特征进行多模态融合，获得融合特征；S3、根据融合特征和语义特征生成答案。本发明公开的人工智能视频问答方法，参数量小，运算速度快，能够正确理解问题和备选答案、各备选答案间的逻辑关系，得到的答案准确率有明显提高。

公开/授权文献

CN112036276B 一种人工智能视频问答方法公开/授权日：2023-04-07

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06K	图形数据读取（图像或视频识别或理解G06V）；数据的呈现；记录载体；处理记录载体
G06K9/00	识别模式的方法或装置（图形读取或将机械参数模式（例如力或存在）转换为电信号的方法或装置 G06K11/00）（图像或视频识别或理解 G06V）（语音识别 G10L15/00 )