-
公开(公告)号:CN118799653A
公开(公告)日:2024-10-18
申请号:CN202411267049.3
申请日:2024-09-11
Applicant: 国网山东省电力公司济南供电公司 , 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/22 , G06N3/0464 , G06N3/08
Abstract: 本发明的一种隐式语义关联建模方法、零样本图像分类方法及装置,属于图像处理技术领域,零样本图像分类方法包括以下步骤:步骤1,获取测试图像和源图像,所述测试图像为未标注的目标图像,所述源图像为标记好的图像;步骤2,利用源图像进行模型训练,获得语义相关性预测模型g(*);步骤3,计算测试图像的隐含语义表示;步骤4,计算测试图像与每个源图像之间的语义关联矩阵Hi,t;步骤5,利用语义相关性预测模型g(*)预测测试图像与每个源图像之间的语义一致性,并将测试图像分类到平均语义一致性最大的类别。本发明在多个公共数据集上表现出色,并持续提高分类准确率,具有较好的判别力和泛化能力。
-
公开(公告)号:CN118799653B
公开(公告)日:2025-04-29
申请号:CN202411267049.3
申请日:2024-09-11
Applicant: 国网山东省电力公司济南供电公司 , 中国科学院自动化研究所
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/22 , G06N3/0464 , G06N3/08
Abstract: 本发明的一种隐式语义关联建模方法、零样本图像分类方法及装置,属于图像处理技术领域,零样本图像分类方法包括以下步骤:步骤1,获取测试图像和源图像,所述测试图像为未标注的目标图像,所述源图像为标记好的图像;步骤2,利用源图像进行模型训练,获得语义相关性预测模型g(*);步骤3,计算测试图像的隐含语义表示;步骤4,计算测试图像与每个源图像之间的语义关联矩阵Hi,t;步骤5,利用语义相关性预测模型g(*)预测测试图像与每个源图像之间的语义一致性,并将测试图像分类到平均语义一致性最大的类别。本发明在多个公共数据集上表现出色,并持续提高分类准确率,具有较好的判别力和泛化能力。
-
公开(公告)号:CN118397070A
公开(公告)日:2024-07-26
申请号:CN202410368968.3
申请日:2024-03-28
Applicant: 中国科学院自动化研究所
IPC: G06T7/593 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种训练方法及系统、环境深度估计方法及系统,属于计算机视觉和机器人领域,所述训练方法包括:构建合成数据集;构建双目数据集;利用所述合成数据集对所述双目深度估计深度学习神经网络进行预训练,得到预训练后的双目深度估计深度学习神经网络;利用所述双目数据集对所述预训练后的双目深度估计深度学习神经网络进行训练,得到训练后的双目深度估计深度学习神经网络;所述环境深度估计方法,包括:获取待处理环境立体图像;将所述待处理环境立体图像输入到训练后的双目深度估计深度学习神经网络中,得到所述待处理环境立体图像的深度图像,该方法及系统能够避免双目数据集深度标注过于稀疏对算法收敛性的影响。
-
公开(公告)号:CN118229778A
公开(公告)日:2024-06-21
申请号:CN202410255261.1
申请日:2024-03-06
Applicant: 中国科学院自动化研究所
IPC: G06T7/73 , G06V10/25 , G06V10/766 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及图像识别技术领域,尤其涉及一种基于动态蛇形卷积的火车车钩姿态估计方法。本发明通过设计包含目标检测模块,几何特征提取模块和位姿回归模块的车钩姿态估计网络,利用动态蛇形卷积引入变形偏移,在自由选择的同时确保感受的连续性,基于车钩的几何特征进行姿态回归可以得到车钩姿态估计结果,克服由于车钩狭窄细长的管状特征导致网络无法提取有效特征而对位姿估计算法精度造成的影响,从而实现提升火车车钩姿态估计的精确度。
-
-
-