一种深度神经网络模型的训练方法及装置

    公开(公告)号:CN114913405A

    公开(公告)日:2022-08-16

    申请号:CN202210661970.0

    申请日:2022-06-13

    摘要: 本申请公开了一种深度神经网络模型的训练方法及装置。本申请实施例提供的方法首先采用样本量充足的第一类别的图像样本对初始检测模型和初始难度预测模型进行联合训练,并将训练后的初始检测模型确定为候选检测模型,将训练后的初始难度预测模型确定为候选难度预测模型。经过联合训练的候选检测模型和候选难度预测模型具备了一定的学习能力,为后续模型学习样本量稀缺的图像样本提供了基础。然后使用样本量充足的第一类别的图像样本和样本量稀缺的第二类别的图像样本对候选检测模型和候选难度预测模型进行联合训练,以使候选检测模型和候选难度模型能够快速学习样本量稀缺的图像样本的特征,以此在保证模型训练效率的同时,还提高了模型的精度。