发明授权
- 专利标题: 一种视觉定位方法、装置、设备及介质
-
申请号: CN202210407177.8申请日: 2022-04-19
-
公开(公告)号: CN114511472B公开(公告)日: 2022-07-08
- 发明人: 李晓川 , 李仁刚 , 赵雅倩 , 郭振华 , 范宝余
- 申请人: 苏州浪潮智能科技有限公司
- 申请人地址: 江苏省苏州市吴中经济开发区郭巷街道官浦路1号9幢
- 专利权人: 苏州浪潮智能科技有限公司
- 当前专利权人: 苏州浪潮智能科技有限公司
- 当前专利权人地址: 江苏省苏州市吴中经济开发区郭巷街道官浦路1号9幢
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 柳虹
- 主分类号: G06T5/00
- IPC分类号: G06T5/00 ; G06T9/00 ; G06T7/70
摘要:
本申请公开了一种视觉定位方法、装置、设备及介质,涉及人工智能技术领域,该方法包括:对图像编码特征与文本编码特征进行特征拼接;对拼接后编码特征进行特征融合,得到第一融合后编码特征;基于预设跨注意力机制分别对第一融合后编码特征与文本编码特征进行噪声修正,得到修正后融合特征与修正后文本编码特征,对拼接后编码特征与修正后文本编码特征进行特征融合得到第二融合后编码特征;利用基于修正后融合特征和第二融合后编码特征确定的目标编码特征对预设框特征进行修正,以预测目标视觉物体的区域位置坐标,可见,本申请基于预设跨注意力机制对图文噪声进行修正,通过降低对文本中噪声部分的关注度削弱了噪声的影响,实现抗噪视觉定位。
公开/授权文献
- CN114511472A 一种视觉定位方法、装置、设备及介质 公开/授权日:2022-05-17