半监督目标检测模型的训练、目标检测方法及装置

    公开(公告)号:CN118865009A

    公开(公告)日:2024-10-29

    申请号:CN202310475583.2

    申请日:2023-04-27

    摘要: 本申请实施例提供了半监督目标检测模型的训练、目标检测方法及装置,先基于样本图像数据集进行实例平衡采样,得到第一样本图像集合;并基于第一样本图像集合对初始目标检测模型中第一参数集进行迭代训练,得到第一目标检测模型;然后基于样本图像数据集进行类别平衡采样,得到第二样本图像集合;并基于第二样本图像集合对第一目标检测模型中第二参数集进行迭代训练,得到第二目标检测模型;最后基于第二目标检测模型确定最终的半监督目标检测模型;这样将整个训练过程拆分为两个训练阶段,且在不同训练阶段的图像样本采样方式和参数学习侧重点均有所不同,从而使得最终训练得到的目标检测模型能够同时确保对大类别和小类别的目标检测准确度。

    图像处理方法和装置
    2.
    发明公开

    公开(公告)号:CN117953250A

    公开(公告)日:2024-04-30

    申请号:CN202311502232.2

    申请日:2023-11-10

    发明人: 王淳 王钰

    IPC分类号: G06V10/762 G06V10/74

    摘要: 本申请公开了一种图像处理方法和装置,该方法包括:获取待处理图像的第一聚类结果;根据第一图像模型对第一聚类结果进行特征提取,得到第一图像特征集合,以及使用第一文本模型对表征用户聚类意图的目标文本进行特征提取,得到文本特征;根据第一图像特征集合和文本特征对第一聚类结果进行合并处理,得到第一交互图像集合;根据第一图像模型对第一交互图像集合进行特征提取,得到第二图像特征集合;根据第二图像特征集合和文本特征对第一交互图像集合进行拆分处理,得到第二交互图像集合。由此,通过与表征用户聚类意图的文本进行两次交互聚类对图像的聚类结果进行调整,可以得到满足用户聚类需求的聚类结果。

    模型训练方法、图像分类方法及相关装置

    公开(公告)号:CN118657970A

    公开(公告)日:2024-09-17

    申请号:CN202410347300.0

    申请日:2024-03-25

    发明人: 王钰 王淳

    摘要: 本申请提供了一种模型训练方法、图像分类方法及相关装置;方法包括:通过图像处理模型对第一图像和第二图像进行特征提取,得到第一图像的第一图像特征和第二图像的第二图像特征;基于第一图像特征与第二图像特征之间的相似性,确定第一图像与第二图像之间的成对相似性;基于第一图像的邻居图像集与第二图像的邻居图像集,确定第一图像与第二图像之间的上下文相似性;基于成对相似性与上下文相似性更新图像处理模型的参数。通过本申请,能够提升图像分类的准确性。

    目标检测模型训练方法、检测方法及装置、设备、介质

    公开(公告)号:CN118155011A

    公开(公告)日:2024-06-07

    申请号:CN202211579277.5

    申请日:2022-12-07

    摘要: 本公开提供了一种目标检测模型训练方法、检测方法及装置、设备、介质,该方法包括:利用学生模型基于无标注图像的语义特征对感兴趣区域的类进行预测,获得感兴趣区域的语义分类预测结果;利用教师模型和原型类集合对无标注图像中感兴趣区域进行语义相似性分类,获得感兴趣区域的语义伪标签;基于语义分类预测结果、语义伪标签和预设的语义对齐损失函数计算语义对齐损失;基于语义对齐损失更新学生模型中的模型参数,以及,利用学生模型中的模型参数更新教师模型中的模型参数,在满足终止条件的情况下,将教师模型确定为目标检测模型。本公开实施例提供的目标检测模型训练方法,可以降低训练成本,并提高模型的目标检测的精度。

    图像识别模型的训练、图像识别方法及装置

    公开(公告)号:CN117496286A

    公开(公告)日:2024-02-02

    申请号:CN202310544945.9

    申请日:2023-05-15

    摘要: 本申请实施例提供了图像识别模型的训练、图像识别方法及装置,针对每次模型参数更新,通过利用经过上一次参数更新后的自监督模型基于目标无标签样本图像对应的n个增强变换样本图像进行特征处理,得到目标无标签样本图像对应的多个特征向量子集;然后,基于目标无标签样本图像对应的多个特征向量子集、目标负样本特征向量集合和预设内存库中的历史负样本特征向量集合,确定自监督对比损失函数;再基于该损失函数进行模型参数更新,这样能够同时考虑目标无标签样本的当前批次负样本对比损失、正样本相似度损失、历史批次负样本对比损失这三个损失维度进行参数更新,从而提高模型参数更新准确度,进而提高模型图像识别准确度。

    模型训练方法、目标检测方法及装置

    公开(公告)号:CN117437394A

    公开(公告)日:2024-01-23

    申请号:CN202210829603.7

    申请日:2022-07-15

    摘要: 本申请实施例提供了一种模型训练方法、目标检测方法及装置,该方法包括:在模型训练阶段,通过基于第一参考边界框、及其对应的实际边界框,促使待训练的目标检测模型不断学习边界框分布,使得预测得到的第一预测边界框更加接近于对应的实际边界框,从而提高训练后的目标检测模型的边界框预测准确度、模型泛化性和数据迁移性;并且用于确定边界框回归损失值的比对结果集合不仅包括表征边界框分布相似程度的第一比对结果,还包括表征边界框坐标重合程度的第二比对结果,使得基于第一比对结果和第二比对结果得到的边界框回归损失值的准确度更高,从而能够进一步提高基于该边界框回归损失值更新后的模型参数的准确度。

    边界框分布模型的训练、目标检测方法及装置

    公开(公告)号:CN117132754A

    公开(公告)日:2023-11-28

    申请号:CN202210529208.7

    申请日:2022-05-16

    摘要: 本说明书实施例公开了一种边界框分布模型的训练方法,以解决现有的目标检测模型的网络预测的不确定性问题,提升目标检测的准确性。所述方法包括:获取样本锚框图像集,每个样本锚框图像包括样本图像中目标对象区域的初始锚框以及对应的真实边界框;将样本锚框图像集输入初始边界框分布模型进行模型迭代训练,直至满足边界框分布模型的收敛条件,得到训练后的边界框分布模型;初始边界框分布模型包括变分自动编码器,边界框分布模型每次模型迭代训练包括:利用变分自动编码器得到包括初始锚框对应的预测边界框的样本预测图像;根据初始锚框、预测边界框、真实边界框、以及预设的边界框分布模型的损失函数,调整边界框分布模型的模型参数。

    目标检测模型的构建方法、装置、电子设备及存储介质

    公开(公告)号:CN118628853A

    公开(公告)日:2024-09-10

    申请号:CN202310234381.9

    申请日:2023-03-10

    摘要: 本公开实施例提供了目标检测模型的构建方法、装置、电子设备以及存储介质,目标检测模型的构建方法包括:获取图像样本集;将图像样本集输入待训练的第一目标检测模型进行训练,得到训练后的第一目标检测模型;其中,目标检测学生模块用于根据图像样本集进行预测处理;目标检测教师模块用于生成目标检测伪标签;特征融合模块用于根据第一编码结果、标注图像样本和无标注图像样本,生成融合特征;目标检测学生模块的模型参数是基于目标检测预测结果、目标检测伪标签及融合特征所更新的;目标检测学生模块还用于根据更新后的模型参数对目标检测教师模块进行参数更新;根据训练后的第一目标检测模型,构建目标检测模型。以此,提高目标检测准确性。

    图像检测模型的训练方法、图像检测方法及装置

    公开(公告)号:CN118823495A

    公开(公告)日:2024-10-22

    申请号:CN202310443541.0

    申请日:2023-04-21

    摘要: 本申请实施例公开了一种图像检测模型的训练方法、图像检测方法及装置。图像检测模型的训练方法包括:获取样本图像数据;将样本图像数据输入待训练的图像检测模型,对具有标签信息的第一样本图像进行图像检测,得到第一样本图像对应的第一检测结果,包括第一样本图像对应的辅助平衡分类信息;对不具有标签信息的第二样本图像进行图像检测,得到第二样本图像对应的第二检测结果,包括第二样本图像对应的辅助平衡分类信息;根据第一检测结果和第二检测结果确定半监督辅助平衡损失函数和半监督图像检测损失函数,进而确定图像检测模型的目标损失函数,根据目标损失函数对图像检测模型的模型参数进行迭代调整。本申请能够提升图像检测模型的准确度。

    模型训练方法、目标检测方法及装置

    公开(公告)号:CN117437397A

    公开(公告)日:2024-01-23

    申请号:CN202210831544.7

    申请日:2022-07-15

    摘要: 本申请实施例提供了模型训练方法、目标检测方法及装置,在模型训练阶段,通过基于第一参考边界框、及其对应的真实边界框和真实类别,促使待训练模型不断学习边界框分布和目标对象类别识别,使得生成子模型针对第一参考边界框所输出的预测结果更加真实,提高模型的目标检测准确度、泛化性和数据迁移性;并且基于判别子模型所输出的判别结果集合确定损失值,再不断基于损失值对模型参数进行多轮迭代更新,其中判别结果集合包括表征边界框分布相似程度的第一判别结果、以及表征第一预测类别与真实类别的类别相似程度的第二判别结果,能够实现同时确保目标检测时目标对象位置标记和目标对象分类的准确度。