- 专利标题: 一种机务段场景视觉问答方法、系统及服务器
-
申请号: CN202110539044.1申请日: 2021-05-18
-
公开(公告)号: CN113222026B公开(公告)日: 2022-11-11
- 发明人: 赵冲 , 帅竞贤 , 卫星 , 李航 , 翟琰 , 葛久松 , 康旭 , 侯宝华 , 陆阳
- 申请人: 合肥工业大学
- 申请人地址: 安徽省合肥市包河区屯溪路193号
- 专利权人: 合肥工业大学
- 当前专利权人: 合肥工业大学
- 当前专利权人地址: 安徽省合肥市包河区屯溪路193号
- 代理机构: 上海光华专利事务所
- 代理商 林凡燕
- 主分类号: G06V10/774
- IPC分类号: G06V10/774 ; G06V10/82 ; G06N3/04 ; G06N3/08 ; G06T7/00 ; G06T7/11
摘要:
本发明提供了一种机务段场景视觉问答方法、系统及服务器,采用机车正常状态和动作前状态的两种机务段场景的图像数据,创建具有双重注意力与动态描述的第一视觉问答模型,通过对两个模块的联合训练,极大地提升在多个需要机车做出反应的场景变化对象同时出现以及场景内干扰物较多情况下的场景视觉问答能力、提高了复杂环境下机务段场景的检测效果,同时提升对于机务段场景视频的动态判断与描述能力,在需引起机车反应的机务段场景对象动态变化时,保持高稳定性的描述,满足了复杂度极高的工业的使用需求。
公开/授权文献
- CN113222026A 一种机务段场景视觉问答方法、系统及服务器 公开/授权日:2021-08-06