- 专利标题: 一种基于多模态查询的图像检索方法、系统、介质及设备
-
申请号: CN202110516225.2申请日: 2021-05-12
-
公开(公告)号: CN113239219B公开(公告)日: 2022-05-20
- 发明人: 宋雪萌 , 聂礼强 , 温皓琨 , 贾永坡 , 杨鑫 , 詹忆冰
- 申请人: 山东大学 , 河钢数字技术股份有限公司
- 申请人地址: 山东省济南市历城区山大南路27号;
- 专利权人: 山东大学,河钢数字技术股份有限公司
- 当前专利权人: 山东大学,河钢数字技术股份有限公司
- 当前专利权人地址: 山东省济南市历城区山大南路27号;
- 代理机构: 济南圣达知识产权代理有限公司
- 代理商 李琳
- 主分类号: G06F16/532
- IPC分类号: G06F16/532 ; G06F16/535 ; G06F16/583 ; G06N3/04
摘要:
本发明提供了一种基于多模态查询的图像检索方法、系统、介质及设备,对参考图像、目标图像和修改文本进行编码,得到图像和文本的局部和全局中间表示;图像和文本的局部中间表示进行细粒度局部组合,图像和文本的全局中间表示经过细粒度全局组合,将局部网络和全局网络进行互学习增强,将局部和全局的参考图像修改表示进行融合,局部和全局的目标图像表示进行相似的融合操作,根据融合之后二者的相似度为依据检索到对应的目标图像,有助于提高图像检索的准确性。
公开/授权文献
- CN113239219A 一种基于多模态查询的图像检索方法、系统、介质及设备 公开/授权日:2021-08-10