一种机务段场景视觉问答方法、系统及服务器

发明授权

CN113222026B 一种机务段场景视觉问答方法、系统及服务器有权

请登陆查看更多内容

专利标题： 一种机务段场景视觉问答方法、系统及服务器
申请号： CN202110539044.1

申请日： 2021-05-18
公开(公告)号： CN113222026B

公开(公告)日： 2022-11-11
发明人: 赵冲 , 帅竞贤 , 卫星 , 李航 , 翟琰 , 葛久松 , 康旭 , 侯宝华 , 陆阳
申请人： 合肥工业大学
申请人地址： 安徽省合肥市包河区屯溪路193号
专利权人： 合肥工业大学
当前专利权人： 合肥工业大学
当前专利权人地址： 安徽省合肥市包河区屯溪路193号
代理机构： 上海光华专利事务所
代理商 林凡燕
主分类号： G06V10/774
IPC分类号： G06V10/774 ; G06V10/82 ; G06N3/04 ; G06N3/08 ; G06T7/00 ; G06T7/11

摘要：

本发明提供了一种机务段场景视觉问答方法、系统及服务器，采用机车正常状态和动作前状态的两种机务段场景的图像数据，创建具有双重注意力与动态描述的第一视觉问答模型，通过对两个模块的联合训练，极大地提升在多个需要机车做出反应的场景变化对象同时出现以及场景内干扰物较多情况下的场景视觉问答能力、提高了复杂环境下机务段场景的检测效果，同时提升对于机务段场景视频的动态判断与描述能力，在需引起机车反应的机务段场景对象动态变化时，保持高稳定性的描述，满足了复杂度极高的工业的使用需求。

公开/授权文献

CN113222026A 一种机务段场景视觉问答方法、系统及服务器公开/授权日：2021-08-06

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V10/00	图像或视频识别或理解的安排（图像或视频中的字符识别 G06V30/10）
G06V10/70	.使用模式识别或机器学习（光学模式识别或电子计算 G06V10/88）
G06V10/77	..处理特征空间中的图像或视频特征；使用数据集成或数据缩减，例如主成分分析 [PCA] 或独立成分分析 [ICA] 或自组织图 [SOM]；盲源分离
G06V10/774	...生成训练模式集；引导方法，例如捕获或促进