模型训练方法、任务处理方法、装置、程序产品和设备

    公开(公告)号:CN118917440A

    公开(公告)日:2024-11-08

    申请号:CN202411322812.8

    申请日:2024-09-20

    IPC分类号: G06N20/00 G06F18/24 G06F18/21

    摘要: 本公开提供一种模型训练方法及装置、任务处理方法及装置、计算机程序产品和电子设备,涉及计算机技术领域。该模型训练方法包括:从初始训练样本集中采集当前训练批次的训练样本,训练样本包括基于样本评估模型从初始训练样本集中获取的困难样本;基于训练样本对大语言模型进行训练,并根据训练样本的训练损失值对训练样本标注类别标签,类别标签用于指示训练样本是否为困难样本;根据训练样本和对应的类别标签对样本评估模型进行训练,以完成当前训练批次;进入下一训练批次,直到大语言模型完成训练停止,得到训练完成的大语言模型。本公开可提高大语言模型的训练精度和训练效率。

    物品信息分析模型的生成方法、生成装置和电子设备

    公开(公告)号:CN118864042A

    公开(公告)日:2024-10-29

    申请号:CN202410809680.5

    申请日:2024-06-21

    摘要: 本公开的实施例公开了物品信息分析模型的生成方法、生成装置和电子设备。该方法的一具体实施方式包括:根据待分析物品的属性信息构建训练数据;根据训练数据生成预设格式的输入数据,其中,输入数据采用指示判断样本物品对是否相匹配的分类性描述语句;将输入数据输入预先创建的大语言模型中,输出对应的预测结果,以及根据预测结果和对应的样本标签确定损失函数值,以调整大语言模型的模型参数继续训练;响应于确定大语言模型训练完成,将训练完成的大语言模型作为物品信息分析模型。该实施方式与同品判别技术有关,可以利用大语言模型强大的语义理解能力,来自动挖取物品属性信息描述中的语义,有利于提高模型预测的准确度。

    半监督分类模型训练、图像分类方法和装置

    公开(公告)号:CN115908933A

    公开(公告)日:2023-04-04

    申请号:CN202211541994.9

    申请日:2022-12-02

    摘要: 本公开提供了一种半监督分类模型训练方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:对获取的素材样本进行序列化处理,得到素材序列;对素材序列进行随机掩码处理,得到包括整体语义特征的掩码序列;将素材序列和掩码序列输入预先构建的半监督分类网络的掩码预测网络中,计算得到掩码预测网络的掩码预测损失;将带目标标签且经过掩码预测网络预测的整体语义特征输入半监督分类网络的线性分类网络,计算得到线性分类网络的监督损失;基于掩码预测损失和监督损失,训练半监督分类网络,得到对应半监督分类网络的半监督分类模型。该实施方式提高了半监督分类模型的分类性能。