发明公开
- 专利标题: 一种基于多级别网络的图像文本检索方法
-
申请号: CN202111619401.1申请日: 2021-12-27
-
公开(公告)号: CN114357148A公开(公告)日: 2022-04-15
- 发明人: 冯永 , 杨磊 , 王永恒
- 申请人: 之江实验室 , 重庆大学
- 申请人地址: 浙江省杭州市文一西路1818号;
- 专利权人: 之江实验室,重庆大学
- 当前专利权人: 之江实验室,重庆大学
- 当前专利权人地址: 浙江省杭州市文一西路1818号;
- 代理机构: 重庆博凯知识产权代理有限公司
- 代理商 黄河
- 主分类号: G06F16/338
- IPC分类号: G06F16/338 ; G06F16/33 ; G06K9/62 ; G06V30/148 ; G06V10/40 ; G06V30/19
摘要:
本发明涉及图像文本检索技术领域,具体涉及一种基于多级别网络的图像文本检索方法,包括:构建具有全局级别子网络、关系级别子网络和数字级别子网络的图文检索模型;构建用于训练图文检索模型的训练数据集,训练数据集中包括图像文本对;将训练数据集中的图像文本对分别输入图文检索模型的全局级别子网络、关系级别子网络和数字级别子网络,以分别生成对应的全局级别相似度、关系级别相似度和数字级别相似度并单独训练对应的子网络;基于训练完成的图文检索模型进行图像文本检索。本发明中的图像文本检索方法能够提升图像文本的检索效率和检索准确性,从而能够提升图像文本检索的效果。