发明公开
- 专利标题: 一种视觉问答方法、系统及服务器
-
申请号: CN202110540093.7申请日: 2021-05-18
-
公开(公告)号: CN113205507A公开(公告)日: 2021-08-03
- 发明人: 卫星 , 沈奥 , 韩知渊 , 翟琰 , 李航 , 葛久松 , 陆阳 , 赵冲
- 申请人: 合肥工业大学
- 申请人地址: 安徽省合肥市包河区屯溪路193号
- 专利权人: 合肥工业大学
- 当前专利权人: 合肥工业大学
- 当前专利权人地址: 安徽省合肥市包河区屯溪路193号
- 代理机构: 上海光华专利事务所
- 代理商 林凡燕
- 主分类号: G06T7/00
- IPC分类号: G06T7/00 ; G06T7/11 ; G06F16/332 ; G06F16/58 ; G06F16/583 ; G06F16/78 ; G06F16/783 ; G06F16/215 ; G06Q50/06 ; G07C1/20
摘要:
本发明提供一种视觉问答方法、系统及服务器,包括:获取输电设备的图像数据,图像数据包括视频数据和图片数据;预处理图像数据,得到原始数据集;对原始数据集依次进行视觉问答标注和语义分割标注,得到视觉问答数据集;对视觉问答数据集进行训练,得到视觉问答模型;输入问题文本和图片到视觉问答模型,得到视觉问答结果。本发明对图像数据进行视觉问答标注和语义分割标注,得到视觉问答数据集,从而建立了图像数据的语义分割与文本问答之间的图文链接;根据该视觉问答数据集训练得到的视觉问答模型,以图文链接作为锚点,将输入的图片与文本在语义上对齐,提高了视觉问答模型的性能,获得了更加准确的视觉问答结果。
公开/授权文献
- CN113205507B 一种视觉问答方法、系统及服务器 公开/授权日:2023-03-10