一种面向多标记目标检测任务的标签带噪数据集扩增方法

    公开(公告)号:CN114201632B

    公开(公告)日:2022-05-06

    申请号:CN202210149500.6

    申请日:2022-02-18

    摘要: 本发明属于计算机图像生成技术领域,公开了一种面向多标记目标检测任务的标签带噪数据集扩增方法,该方法针对深度神经网络容易过拟合噪声标签的问题,引入干净标签估计矩阵,以空间变换网络作为骨干网络的条件生成对抗网络,从标签带噪的目标检测数据集中学习到干净的标签条件生成分布,在指定目标边界框位置生成指定类别的目标的图像,在测试阶段基于给定的类别标签和边界框信息生成目标检测数据集。本发明通过引入考虑标签噪声的用于图像真假分类的损失函数,可使模型条件生成对抗网络模型从标签带噪且类别不平衡的多目标检测数据集中,生成高质量标注的多目标检测图像,扩增了目标检测数据集,缓解了对带有准确标注信息的数据日益增大的需求。

    基于带有闭集噪声和开集噪声标签的鲁棒学习方法

    公开(公告)号:CN116757261A

    公开(公告)日:2023-09-15

    申请号:CN202311031130.7

    申请日:2023-08-16

    摘要: 本发明公开了一种基于带有闭集噪声和开集噪声标签的鲁棒学习方法,该方法旨在利用有用的开集示例,同时最大限度地减少闭集错误标记示例的负面影响。本发明分为两个阶段,第一阶段中,利用干净样本选择策略做训练初始化,并记录下来样本修正标记以及标记修正记录供第二阶段优化;在第二阶段中,利用Class Expansion的思想,将部分开集样本融入已知类进行训练,将剩余的具有判别性的开集样本进一步帮助模型提升其判别性。本发明方法针对数据集中存在闭集噪声和开集噪声的问题,使用了类扩展的思想,接纳了一部分开集类别样本,并且充分利用了剩余的开集样本,进一步提升了深度学习模型的准确率。

    基于带有噪声和不平衡的类标签的鲁棒学习方法

    公开(公告)号:CN115331088B

    公开(公告)日:2023-01-03

    申请号:CN202211250443.7

    申请日:2022-10-13

    发明人: 李绍园 王蕾

    摘要: 本发明公开了一种基于带有噪声和不平衡的类标签的鲁棒学习方法,其包括如下步骤:获取带有噪声且分布不平衡的数据集;初始化各项参数;搭建模型与损失函数;将数据集输入模型中进行初始训练;每次迭代训练前,教师模型将原始数据集划分为伪干净数据集和伪噪声数据集;将伪干净数据集输入模型中进行无监督对比学习以及蒸馏训练;将伪噪声数据集输入模型中进行组内对比学习以及蒸馏训练;训练完成后,使用教师模型分类器对图像进行类别预测任务。本发明方法针对数据集中不平衡分布的问题,进一步采用重加权的方式,使得在训练后期模型侧重于学习样本量较少的类别,提升了深度学习模型的准确率。

    基于带有噪声和不平衡的类标签的鲁棒学习方法

    公开(公告)号:CN115331088A

    公开(公告)日:2022-11-11

    申请号:CN202211250443.7

    申请日:2022-10-13

    发明人: 李绍园 王蕾

    摘要: 本发明公开了一种基于带有噪声和不平衡的类标签的鲁棒学习方法,其包括如下步骤:获取带有噪声且分布不平衡的数据集;初始化各项参数;搭建模型与损失函数;将数据集输入模型中进行初始训练;每次迭代训练前,教师模型将原始数据集划分为伪干净数据集和伪噪声数据集;将伪干净数据集输入模型中进行无监督对比学习以及蒸馏训练;将伪噪声数据集输入模型中进行组内对比学习以及蒸馏训练;训练完成后,使用教师模型分类器对图像进行类别预测任务。本发明方法针对数据集中不平衡分布的问题,进一步采用重加权的方式,使得在训练后期模型侧重于学习样本量较少的类别,提升了深度学习模型的准确率。

    一种基于多专家系统和知识蒸馏的众包图像学习方法

    公开(公告)号:CN114299349A

    公开(公告)日:2022-04-08

    申请号:CN202210205861.8

    申请日:2022-03-04

    发明人: 李绍园 侍野

    摘要: 本发明属于图像标注技术领域,公开了一种基于多专家系统和知识蒸馏的众包图像学习方法,该方法包括:步骤1.获取图像数据,并构造众包标注集;步骤2.使用图像集和众包标注集训练一个深度众包学习模型;步骤3.使用步骤2得到的模型生成第一真实标记预测;步骤4.使用图像集和第一真实标记预测训练一个无噪声建模的噪声标记学习模型;步骤5.使用步骤4得到的模型生成第二真实标记预测;步骤6.使用第二真实标记预测、图像集和众包标注集重新训练一个深度众包学习模型;步骤7.使用步骤4和步骤6的模型预测标记未知图像的真实标记。本发明将深度众包学习方法与无噪声建模的噪声标记学习方法结合,提升了分类器模型图像标记的预测效果。

    一种基于半监督变分自编码器的主动众包图像学习方法

    公开(公告)号:CN112990385B

    公开(公告)日:2021-09-21

    申请号:CN202110531443.3

    申请日:2021-05-17

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于半监督变分自编码器的主动众包图像学习方法,具体为:获取图片集,随机抽选一定比例的图像,将其分发给网络上的标注者进行标注,获得众包标记;搭建基于半监督变分自编码器的众包学习网络模型;将数据集输入模型,构造损失函数;基于随机梯度下降,端到端地对模型进行训练;选择预测真实标记的熵最大的图像,查询真实标记;与上一轮迭代所使用的训练集组合,生成新的数据集,返回第三步,直到当前迭代次数到达阈值为止;删去模型重构部分和众包映射层部分,将网络的剩余部分作为分类器。本发明同时利用众包数据和无标记数据,降低数据的标注成本。并通过引入少量真实标记,来缓解模型对于噪声的过拟合,提高模型的泛化性能。