一种基于深度贝叶斯学习的图像标记估计方法

    公开(公告)号:CN112001422A

    公开(公告)日:2020-11-27

    申请号:CN202010734902.3

    申请日:2020-07-28

    发明人: 李绍园 侍野

    IPC分类号: G06K9/62 G06K9/36 G06K9/46

    摘要: 本发明提出了一种基于深度贝叶斯学习的图像标记估计方法,包括以下步骤:1)获取图像数据,将图像分发给网络上的标注者进行预标注,构造图像众包标记数据集;2)对图像做特征预提取处理,获得图像的fisher vector特征表示;3)搭建深度表示学习网络,构建标注生成过程的深度贝叶斯模型;4)将图像fisher vector特征及众包标记输入深度贝叶斯模型,基于图像和参数联合概率似然构造变分下界损失函数;5)基于自然梯度随机变分推断,端到端地对深度贝叶斯模型进行训练;6)返回模型输出的图像真实标记估计及各标注者的混淆矩阵。本发明克服了EM迭代式训练的低效率和非贝叶斯学习不可解释性的问题,提高了图像标记估计的效果。

    一种用于极小批量流数据的测试时适应图像分类方法

    公开(公告)号:CN118097314A

    公开(公告)日:2024-05-28

    申请号:CN202410508289.1

    申请日:2024-04-26

    IPC分类号: G06V10/764 G06V10/774

    摘要: 本发明属于测试时适应技术领域,具体公开了一种用于极小批量流数据的测试时适应图像分类方法。本发明方法针对图像分类的资源受限情况下,每个时间步模型的输入图像的批量很小导致传统的TTA方法在面对极小批量时存在的负迁移现象,采用动态BN校准、熵加权的梯度累加以及代理计算图等关键方法,通过对模型历史信息和泰勒级数的利用,优化BN层的统计量估计,同时对梯度更新进行限制与设计,提高了模型的适应性和泛化能力。本发明方法可有效缓解极小批量的测试时适应图像分类中的负迁移现象,即使在批量大小为1的情况下也能保持良好的图像分类性能。

    基于解码器迭代筛选的鲁棒噪声多标签图像学习方法

    公开(公告)号:CN115331065B

    公开(公告)日:2023-03-24

    申请号:CN202211251614.8

    申请日:2022-10-13

    发明人: 李绍园 陈佳瑶

    摘要: 本发明属于图像学习技术领域,公开了一种基于解码器迭代筛选的鲁棒噪声多标签图像学习方法。该方法针对多标记图像分类存在多标、漏标和错标的问题,提出采用基于解码器的迭代筛选噪声机制,以恢复样本的错误标注,从而提升深度学习模型在噪声多标记上的准确率,具体包括如下步骤:获取训练图像集及多标签噪声标注;初始化各项参数;搭建深度学习模型、损失函数以及正则化项;将训练集图像及标注依次输入多标记分类器;每次迭代筛选时调整模型状态以检测噪声标记,为噪声样本重新预测伪标记,统计标记共现概率并输入标记模型进行微调;训练完成后,使用训练获得的分类器对图像进行类别预测任务。

    基于自训练噪声标签纠正的鲁棒领域自适应图像学习方法

    公开(公告)号:CN114283287A

    公开(公告)日:2022-04-05

    申请号:CN202210221128.5

    申请日:2022-03-09

    发明人: 李绍园 曹正涛

    摘要: 本发明公开了一种基于自训练噪声标签纠正的鲁棒领域自适应图像学习方法,其包括如下步骤:获取源域、目标域图像集和源域低质量标注;初始化各项参数;搭建模型与损失函数;将源域和目标域图像集依次输入两个标记分类器;每次迭代训练前两个标记分类器分别为对方检测噪声,然后为噪声源域样本和目标域样本重新预测伪标记,并重平衡采样参与下一轮迭代训练;目标域伪标注集输入目标域特定网络训练;训练完成后,使用目标域特定分类器对目标域图像进行类别预测任务。本发明方法针对源域与目标域类别分布存在不一致的问题,采用重平衡的采样伪标记样本机制,使得源域和目标域每个类别的采样比例达到一致,提升了深度学习模型在目标域上的准确率。

    一种面向多标记目标检测任务的标签带噪数据集扩增方法

    公开(公告)号:CN114201632A

    公开(公告)日:2022-03-18

    申请号:CN202210149500.6

    申请日:2022-02-18

    摘要: 本发明属于计算机图像生成技术领域,公开了一种面向多标记目标检测任务的标签带噪数据集扩增方法,该方法针对深度神经网络容易过拟合噪声标签的问题,引入干净标签估计矩阵,以空间变换网络作为骨干网络的条件生成对抗网络,从标签带噪的目标检测数据集中学习到干净的标签条件生成分布,在指定目标边界框位置生成指定类别的目标的图像,在测试阶段基于给定的类别标签和边界框信息生成目标检测数据集。本发明通过引入考虑标签噪声的用于图像真假分类的损失函数,可使模型条件生成对抗网络模型从标签带噪且类别不平衡的多目标检测数据集中,生成高质量标注的多目标检测图像,扩增了目标检测数据集,缓解了对带有准确标注信息的数据日益增大的需求。

    一种基于双重主动查询的标签带噪图像学习方法

    公开(公告)号:CN113255849B

    公开(公告)日:2021-10-01

    申请号:CN202110792414.2

    申请日:2021-07-14

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于双重主动查询的标签带噪图像学习方法,其包括步骤:搭建深度卷积神经网络分类器及噪声转移矩阵,在带噪数据集上预训练分类器及噪声转移矩阵;挑选图像集,获取挑选图像集的真实标签;使用挑选的图像集及真实标签更新噪声转移矩阵;初始化基于噪声转移矩阵的分类器;构建真实标签上的损失函数和噪声标签上的损失函数;基于随机梯度下降最小化真实标签损失及噪声标签损失,更新分类器参数;重复迭代过程至最大迭代次数K,完成深度卷积神经网络分类器g的训练。本发明使用噪声转移矩阵建立噪声模型,并引入真实标签估计噪声转移矩阵及改善分类器;通过设计双重主动查询方法,在节省标注成本的同时最大化提高分类器学习准确率。

    一种基于双重主动查询的标签带噪图像学习方法

    公开(公告)号:CN113255849A

    公开(公告)日:2021-08-13

    申请号:CN202110792414.2

    申请日:2021-07-14

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于双重主动查询的标签带噪图像学习方法,其包括步骤:搭建深度卷积神经网络分类器及噪声转移矩阵,在带噪数据集上预训练分类器及噪声转移矩阵;挑选图像集,获取挑选图像集的真实标签;使用挑选的图像集及真实标签更新噪声转移矩阵;初始化基于噪声转移矩阵的分类器;构建真实标签上的损失函数和噪声标签上的损失函数;基于随机梯度下降最小化真实标签损失及噪声标签损失,更新分类器参数;重复迭代过程至最大迭代次数K,完成深度卷积神经网络分类器g的训练。本发明使用噪声转移矩阵建立噪声模型,并引入真实标签估计噪声转移矩阵及改善分类器;通过设计双重主动查询方法,在节省标注成本的同时最大化提高分类器学习准确率。

    在线流数据中带有未见类和噪声标签的图像分类方法

    公开(公告)号:CN118097319B

    公开(公告)日:2024-07-16

    申请号:CN202410523806.2

    申请日:2024-04-29

    摘要: 本发明属于图像处理技术领域,具体公开了一种在线流数据中带有未见类和噪声标签的图像分类方法。本发明方法通过学习每个已知类别的代表性和区分性原型建立了一种基于原型的记忆策略,在线索化知识表示的同时实现对噪声标签的有效管理。为了在表示空间内判别和消减未知类别产生的负面影响,本发明引入了基于相似性匹配的去噪机制。此外本发明设计了一种双分类器架构,通过不断进行分类器的自校正和互验证来提高系统的稳健性。本发明方法不仅确保了已知类别的知识保持最新,也为处理未知类别提供了强有力的支持,有利于提升模型在面对真实世界动态环境时的适应性和持久性。本发明有助于优化模型在在线学习过程中的记忆和泛化能力。

    在线流数据中带有未见类和噪声标签的图像分类方法

    公开(公告)号:CN118097319A

    公开(公告)日:2024-05-28

    申请号:CN202410523806.2

    申请日:2024-04-29

    摘要: 本发明属于图像处理技术领域,具体公开了一种在线流数据中带有未见类和噪声标签的图像分类方法。本发明方法通过学习每个已知类别的代表性和区分性原型建立了一种基于原型的记忆策略,在线索化知识表示的同时实现对噪声标签的有效管理。为了在表示空间内判别和消减未知类别产生的负面影响,本发明引入了基于相似性匹配的去噪机制。此外本发明设计了一种双分类器架构,通过不断进行分类器的自校正和互验证来提高系统的稳健性。本发明方法不仅确保了已知类别的知识保持最新,也为处理未知类别提供了强有力的支持,有利于提升模型在面对真实世界动态环境时的适应性和持久性。本发明有助于优化模型在在线学习过程中的记忆和泛化能力。

    基于解码器迭代筛选的鲁棒噪声多标签图像学习方法

    公开(公告)号:CN115331065A

    公开(公告)日:2022-11-11

    申请号:CN202211251614.8

    申请日:2022-10-13

    发明人: 李绍园 陈佳瑶

    摘要: 本发明属于图像学习技术领域,公开了一种基于解码器迭代筛选的鲁棒噪声多标记图像学习方法。该方法针对多标记图像分类存在多标、漏标和错标的问题,提出采用基于解码器的迭代筛选噪声机制,以恢复样本的错误标注,从而提升深度学习模型在噪声多标记上的准确率,具体包括如下步骤:获取训练图像集及多标签噪声标注;初始化各项参数;搭建深度学习模型、损失函数以及正则化项;将训练集图像及标注依次输入多标记分类器;每次迭代筛选时调整模型状态以检测噪声标记,为噪声样本重新预测伪标记,统计标记共现概率并输入标记模型进行微调;训练完成后,使用训练获得的分类器对图像进行类别预测任务。