一种基于多专家系统和知识蒸馏的众包图像学习方法

    公开(公告)号:CN114299349A

    公开(公告)日:2022-04-08

    申请号:CN202210205861.8

    申请日:2022-03-04

    发明人: 李绍园 侍野

    摘要: 本发明属于图像标注技术领域,公开了一种基于多专家系统和知识蒸馏的众包图像学习方法,该方法包括:步骤1.获取图像数据,并构造众包标注集;步骤2.使用图像集和众包标注集训练一个深度众包学习模型;步骤3.使用步骤2得到的模型生成第一真实标记预测;步骤4.使用图像集和第一真实标记预测训练一个无噪声建模的噪声标记学习模型;步骤5.使用步骤4得到的模型生成第二真实标记预测;步骤6.使用第二真实标记预测、图像集和众包标注集重新训练一个深度众包学习模型;步骤7.使用步骤4和步骤6的模型预测标记未知图像的真实标记。本发明将深度众包学习方法与无噪声建模的噪声标记学习方法结合,提升了分类器模型图像标记的预测效果。

    一种基于半监督变分自编码器的主动众包图像学习方法

    公开(公告)号:CN112990385B

    公开(公告)日:2021-09-21

    申请号:CN202110531443.3

    申请日:2021-05-17

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于半监督变分自编码器的主动众包图像学习方法,具体为:获取图片集,随机抽选一定比例的图像,将其分发给网络上的标注者进行标注,获得众包标记;搭建基于半监督变分自编码器的众包学习网络模型;将数据集输入模型,构造损失函数;基于随机梯度下降,端到端地对模型进行训练;选择预测真实标记的熵最大的图像,查询真实标记;与上一轮迭代所使用的训练集组合,生成新的数据集,返回第三步,直到当前迭代次数到达阈值为止;删去模型重构部分和众包映射层部分,将网络的剩余部分作为分类器。本发明同时利用众包数据和无标记数据,降低数据的标注成本。并通过引入少量真实标记,来缓解模型对于噪声的过拟合,提高模型的泛化性能。

    一种基于深度贝叶斯学习的图像标记估计方法

    公开(公告)号:CN112001422B

    公开(公告)日:2024-04-02

    申请号:CN202010734902.3

    申请日:2020-07-28

    发明人: 李绍园 侍野

    摘要: 本发明提出了一种基于深度贝叶斯学习的图像标记估计方法,包括以下步骤:1)获取图像数据,将图像分发给网络上的标注者进行预标注,构造图像众包标记数据集;2)对图像做特征预提取处理,获得图像的fisher vector特征表示;3)搭建深度表示学习网络,构建标注生成过程的深度贝叶斯模型;4)将图像fisher vector特征及众包标记输入深度贝叶斯模型,基于图像和参数联合概率似然构造变分下界损失函数;5)基于自然梯度随机变分推断,端到端地对深度贝叶斯模型进行训练;6)返回模型输出的图像真实标记估计及各标注者的混淆矩阵。本发明克服了EM迭代式训练的低效率和非贝叶斯学习不可解释性的问题,提高了图像标记估计的效果。

    一种基于多专家系统和知识蒸馏的众包图像学习方法

    公开(公告)号:CN114299349B

    公开(公告)日:2022-05-13

    申请号:CN202210205861.8

    申请日:2022-03-04

    发明人: 李绍园 侍野

    摘要: 本发明属于图像标注技术领域,公开了一种基于多专家系统和知识蒸馏的众包图像学习方法,该方法包括:步骤1.获取图像数据,并构造众包标注集;步骤2.使用图像集和众包标注集训练一个深度众包学习模型;步骤3.使用步骤2得到的模型生成第一真实标记预测;步骤4.使用图像集和第一真实标记预测训练一个无噪声建模的噪声标记学习模型;步骤5.使用步骤4得到的模型生成第二真实标记预测;步骤6.使用第二真实标记预测、图像集和众包标注集重新训练一个深度众包学习模型;步骤7.使用步骤4和步骤6的模型预测标记未知图像的真实标记。本发明将深度众包学习方法与无噪声建模的噪声标记学习方法结合,提升了分类器模型图像标记的预测效果。

    一种基于半监督变分自编码器的主动众包图像学习方法

    公开(公告)号:CN112990385A

    公开(公告)日:2021-06-18

    申请号:CN202110531443.3

    申请日:2021-05-17

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于半监督变分自编码器的主动众包图像学习方法,具体为:获取图片集,随机抽选一定比例的图像,将其分发给网络上的标注者进行标注,获得众包标记;搭建基于半监督变分自编码器的众包学习网络模型;将数据集输入模型,构造损失函数;基于随机梯度下降,端到端地对模型进行训练;选择预测真实标记的熵最大的图像,查询真实标记;与上一轮迭代所使用的训练集组合,生成新的数据集,返回第三步,直到当前迭代次数到达阈值为止;删去模型重构部分和众包映射层部分,将网络的剩余部分作为分类器。本发明同时利用众包数据和无标记数据,降低数据的标注成本。并通过引入少量真实标记,来缓解模型对于噪声的过拟合,提高模型的泛化性能。

    一种基于深度贝叶斯学习的图像标记估计方法

    公开(公告)号:CN112001422A

    公开(公告)日:2020-11-27

    申请号:CN202010734902.3

    申请日:2020-07-28

    发明人: 李绍园 侍野

    IPC分类号: G06K9/62 G06K9/36 G06K9/46

    摘要: 本发明提出了一种基于深度贝叶斯学习的图像标记估计方法,包括以下步骤:1)获取图像数据,将图像分发给网络上的标注者进行预标注,构造图像众包标记数据集;2)对图像做特征预提取处理,获得图像的fisher vector特征表示;3)搭建深度表示学习网络,构建标注生成过程的深度贝叶斯模型;4)将图像fisher vector特征及众包标记输入深度贝叶斯模型,基于图像和参数联合概率似然构造变分下界损失函数;5)基于自然梯度随机变分推断,端到端地对深度贝叶斯模型进行训练;6)返回模型输出的图像真实标记估计及各标注者的混淆矩阵。本发明克服了EM迭代式训练的低效率和非贝叶斯学习不可解释性的问题,提高了图像标记估计的效果。

    一种基于双重主动查询的标签带噪图像学习方法

    公开(公告)号:CN113255849B

    公开(公告)日:2021-10-01

    申请号:CN202110792414.2

    申请日:2021-07-14

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于双重主动查询的标签带噪图像学习方法,其包括步骤:搭建深度卷积神经网络分类器及噪声转移矩阵,在带噪数据集上预训练分类器及噪声转移矩阵;挑选图像集,获取挑选图像集的真实标签;使用挑选的图像集及真实标签更新噪声转移矩阵;初始化基于噪声转移矩阵的分类器;构建真实标签上的损失函数和噪声标签上的损失函数;基于随机梯度下降最小化真实标签损失及噪声标签损失,更新分类器参数;重复迭代过程至最大迭代次数K,完成深度卷积神经网络分类器g的训练。本发明使用噪声转移矩阵建立噪声模型,并引入真实标签估计噪声转移矩阵及改善分类器;通过设计双重主动查询方法,在节省标注成本的同时最大化提高分类器学习准确率。

    一种基于双重主动查询的标签带噪图像学习方法

    公开(公告)号:CN113255849A

    公开(公告)日:2021-08-13

    申请号:CN202110792414.2

    申请日:2021-07-14

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于双重主动查询的标签带噪图像学习方法,其包括步骤:搭建深度卷积神经网络分类器及噪声转移矩阵,在带噪数据集上预训练分类器及噪声转移矩阵;挑选图像集,获取挑选图像集的真实标签;使用挑选的图像集及真实标签更新噪声转移矩阵;初始化基于噪声转移矩阵的分类器;构建真实标签上的损失函数和噪声标签上的损失函数;基于随机梯度下降最小化真实标签损失及噪声标签损失,更新分类器参数;重复迭代过程至最大迭代次数K,完成深度卷积神经网络分类器g的训练。本发明使用噪声转移矩阵建立噪声模型,并引入真实标签估计噪声转移矩阵及改善分类器;通过设计双重主动查询方法,在节省标注成本的同时最大化提高分类器学习准确率。