-
公开(公告)号:CN116342946A
公开(公告)日:2023-06-27
申请号:CN202310305967.X
申请日:2023-03-27
IPC分类号: G06V10/764 , G06V10/774 , G06N5/04
摘要: 本发明涉及一种面向图像分类的互联网数据集标签噪声比例评估方法,包括如下步骤:S1:获取互联网图片数据集Web‑M,将其划分为带噪声训练集Trainn和带噪声测试集Testn;S2:获得包含与所述数据集Web‑M相同类别的干净测试集Testc;本发明突破现有人工噪声评估方法在大规模互联网数据集噪声比例评估场景下所具有的局限性,在噪声训练集上训练模型,所得模型分别在干净测试集与噪声测试集上进行类别预测,利用噪声引起的准确率差异值,实现自动噪声比例估计。
-
公开(公告)号:CN116894117A
公开(公告)日:2023-10-17
申请号:CN202310838071.8
申请日:2023-07-07
申请人: 浙大城市学院
IPC分类号: G06F16/9532 , G06F16/9538 , G06F16/583 , G06V10/764 , G06V10/774 , G16H20/60
摘要: 本发明公开了一种食物营养库赋图和视觉查询方法、设备和介质,包括基于食物营养库的食物类别搜索网络图片Web‑M,将图片Web‑M分为噪声训练集和噪声测试集,基于噪声训练集训练M类图片分类模型;获取干净测试集,基于M类图片分类模型分别计算干净测试集和噪声测试集的准确率,从而得到准确率差值,以及基于准确率差值估计噪声标签比例;基于cAUM指标对Web‑M图片与食物类别的相关度排序,并基于噪声标签比例获得干净食物图像数据集;基于干净食物图像数据集训练食物图像分类模型,基于食物图像分类模型对给定图片对应食物类别的营养信息进行视觉查询,本发明基于噪声标签比例估计对带噪声图片进行清洗实现食物营养库的图片和模型的扩充,和视觉查询的实现。
-
公开(公告)号:CN114926833A
公开(公告)日:2022-08-19
申请号:CN202210547473.8
申请日:2022-05-18
申请人: 浙大城市学院
IPC分类号: G06V20/68 , G06V10/764 , G06V10/774
摘要: 本发明涉及一种基于类间混淆的层级结构构造和层级分类方法,包括如下步骤:S1:获取食物图像数据集Food‑M,并训练M类平坦分类器,M=M(1);S2:根据M(k)类平坦分类器获得食物各类别之间的发生分类混淆的难易程度,k∈[1,K]且k∈Z;将M(k)个食物类别分成两大类,两大类具有的类别数目分别为其中且遍历探索得到最佳合并方式,使得M(k)类平坦分类器具有最高的大类判别准确率;本发明突破现有层级分类方法在层级结构不明显的大规模分类场景下所具有的局限性,使用平坦分类做大类判别,遍历探索最佳类别合并方式。
-
公开(公告)号:CN115346069A
公开(公告)日:2022-11-15
申请号:CN202210991234.1
申请日:2022-08-18
申请人: 浙大城市学院
IPC分类号: G06V10/764 , G06V10/774 , G06V10/82 , G06V20/68
摘要: 本发明涉及一种基于错误分析的食物图像层级构造和分类方法,包括如下步骤:S1:获取食物图像数据集Food‑M,并训练M类平坦分类器;S2:根据M类平坦分类器在验证集上的预测错误,寻找显著的大类特征,进行类别合并;本发明突破现有层级分类方法在层级结构不明显的大规模分类场景下所具有的局限性,大类判别器辅以平坦分类器充当层级分类器,充分利用层级分类器与平坦分类器的互补优势,并借助第三分类器实现选择性层级分类。
-
-
-