- 专利标题: 一种图像识别方法、装置、设备以及存储介质
-
申请号: CN202410055633.6申请日: 2024-01-15
-
公开(公告)号: CN117576535B公开(公告)日: 2024-06-25
- 发明人: 顾智浩 , 张江宁 , 王亚彪
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 代理机构: 深圳市深佳知识产权代理事务所
- 代理商 张晓
- 主分类号: G06V10/80
- IPC分类号: G06V10/80 ; G06V10/82 ; G06V10/40 ; G06N3/042 ; G06N3/045 ; G06N3/084 ; G06T7/00
摘要:
本申请实施例提供了一种图像识别方法,用于提高对工业图像缺陷的识别准确度。可应用于人工智能、云技术、交通领域等领域。包括:获取待识别对象的主模态图像以及至少一个辅模态图像;调用教师网络对主模态图像进行特征提取得到包括N个不同尺度的特征图的第一特征图集合,并调用教师网络对辅模态图像进行特征提取得到包括N个不同尺度的特征图的第二特征图集合,教师网络为预训练模型;将第一特征图集合与第二特征图集合进行特征融合得到第一多模态特征图集合;调用学生网络基于第一特征图集合和第二特征图集合进行重建,以得到第二多模态特征图集合;根据第一多模态特征图集合和第二多模态特征图集合进行比对,以识别得到待识别对象的缺陷。