抑制标签噪声的图像分类模型训练方法、分类方法及系统

    公开(公告)号:CN111832627B

    公开(公告)日:2022-08-05

    申请号:CN202010567241.X

    申请日:2020-06-19

    发明人: 王非 李江腾

    摘要: 本发明公开了一种抑制标签噪声的图像分类模型训练方法、分类方法及系统,属于图像分类任务领域,包括:将图像数据集划分为训练集和验证集,利用训练集对图像分类模型进行有监督训练;遍历训练集,获得各样本的在模型输出层产生的梯度,并估计梯度模长分布,以计算训练集中样本被错误标定的概率,由此划分出错误标定样本子集和正确标定样本子集;若错误标定样本过少,则利用正确标定样本子集对模型进行有监督训练;否则,舍弃错误标定样本的类别标签后,利用两个样本子集结合半监督学习算法更新模型参数;重复遍历训练集至更新模型参数的步骤直至模型收敛。本发明能够从样本层面降低神经网络模型拟合错标定样本的风险,提高图像分类的准确率。

    抑制标签噪声的图像分类模型训练方法、分类方法及系统

    公开(公告)号:CN111832627A

    公开(公告)日:2020-10-27

    申请号:CN202010567241.X

    申请日:2020-06-19

    发明人: 王非 李江腾

    IPC分类号: G06K9/62 G06N3/08

    摘要: 本发明公开了一种抑制标签噪声的图像分类模型训练方法、分类方法及系统,属于图像分类任务领域,包括:将图像数据集划分为训练集和验证集,利用训练集对图像分类模型进行有监督训练;遍历训练集,获得各样本的在模型输出层产生的梯度,并估计梯度模长分布,以计算训练集中样本被错误标定的概率,由此划分出错误标定样本子集和正确标定样本子集;若错误标定样本过少,则利用正确标定样本子集对模型进行有监督训练;否则,舍弃错误标定样本的类别标签后,利用两个样本子集结合半监督学习算法更新模型参数;重复遍历训练集至更新模型参数的步骤直至模型收敛。本发明能够从样本层面降低神经网络模型拟合错标定样本的风险,提高图像分类的准确率。