-
公开(公告)号:CN118135557A
公开(公告)日:2024-06-04
申请号:CN202410317885.1
申请日:2024-03-20
申请人: 重庆大学 , 重庆市沙坪坝区人民医院
IPC分类号: G06V20/68 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/09
摘要: 本发明涉及一种面向缺少训练样本场景的食物视觉识别方法,该方法使用对抗擦除策略自动发现图像中的成分并学习更全面的表示。该方法包括两个分类器,分别挖掘目标的不同区域。首先,使用一个分类器识别和擦除中间特征图上的局部判别区域。然后,将已擦除的特征输入到另一个分类器中,以发现有关目标的互补信息。此外,使用软标签而非成分标签来监督第二个分类器,从而减少由于样本中不可见的成分而引起的模型偏差。在两个基准数据集上进行了实验证明,包括Food‑101和VIREO Food‑172,并展示了RER相对于最先进的FSFR方法的更好性能。
-
公开(公告)号:CN118504656A
公开(公告)日:2024-08-16
申请号:CN202410694396.8
申请日:2024-05-31
申请人: 重庆大学
IPC分类号: G06N3/096 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N3/084 , G06V10/764 , G06V10/82
摘要: 本发明涉及一种对比扩散零样本学习方法,主要由语义引导的扩散对抗网络模型,对比嵌入模型E以及条件化去噪CD构成。其中S‑DDGAN作为本发明方法的核心,专门设计来解决GZSL中样本质量、模式覆盖及计算成本的均衡问题。在E部分,提出了一种创新架构以应对GZSL中合成视觉特征与语义信息不匹配的挑战。该模型通过在新的嵌入空间内实施对比学习策略,有效提升了分类性能。通过CD环节,利用分类器优化扩散生成器,确保了生成特征的有效性,从而提高判别性分类器的训练效果。
-