-
公开(公告)号:CN118917440A
公开(公告)日:2024-11-08
申请号:CN202411322812.8
申请日:2024-09-20
申请人: 北京沃东天骏信息技术有限公司
摘要: 本公开提供一种模型训练方法及装置、任务处理方法及装置、计算机程序产品和电子设备,涉及计算机技术领域。该模型训练方法包括:从初始训练样本集中采集当前训练批次的训练样本,训练样本包括基于样本评估模型从初始训练样本集中获取的困难样本;基于训练样本对大语言模型进行训练,并根据训练样本的训练损失值对训练样本标注类别标签,类别标签用于指示训练样本是否为困难样本;根据训练样本和对应的类别标签对样本评估模型进行训练,以完成当前训练批次;进入下一训练批次,直到大语言模型完成训练停止,得到训练完成的大语言模型。本公开可提高大语言模型的训练精度和训练效率。
-
公开(公告)号:CN118864042A
公开(公告)日:2024-10-29
申请号:CN202410809680.5
申请日:2024-06-21
申请人: 北京沃东天骏信息技术有限公司
IPC分类号: G06Q30/0601 , G06F40/30 , G06N3/045 , G06N3/096
摘要: 本公开的实施例公开了物品信息分析模型的生成方法、生成装置和电子设备。该方法的一具体实施方式包括:根据待分析物品的属性信息构建训练数据;根据训练数据生成预设格式的输入数据,其中,输入数据采用指示判断样本物品对是否相匹配的分类性描述语句;将输入数据输入预先创建的大语言模型中,输出对应的预测结果,以及根据预测结果和对应的样本标签确定损失函数值,以调整大语言模型的模型参数继续训练;响应于确定大语言模型训练完成,将训练完成的大语言模型作为物品信息分析模型。该实施方式与同品判别技术有关,可以利用大语言模型强大的语义理解能力,来自动挖取物品属性信息描述中的语义,有利于提高模型预测的准确度。
-
公开(公告)号:CN117194972A
公开(公告)日:2023-12-08
申请号:CN202310961155.0
申请日:2023-08-01
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F18/214 , G06N3/04 , G06N3/08
摘要: 本公开的实施例公开了数据集生成方法、装置、电子设备、介质和程序产品。该方法的一具体实施方式包括:基于样本数据集和对应的初始缩放因子集,执行以下确定步骤:根据样本数据集和初始缩放因子集,生成样本缩放数据集;生成针对样本缩放数据集的神经正切核损失值和预测输出损失值;根据神经正切核损失值和预测输出损失值,生成目标损失值;响应于确定目标损失值满足收敛条件,将初始缩放因子集确定为更新后缩放因子集;根据样本数据集和更新后缩放因子集,生成目标样本数据集。该实施方式与人工智能有关,可以准确地从样本数据集中确定出目标样本数据集。
-
公开(公告)号:CN118245857A
公开(公告)日:2024-06-25
申请号:CN202211666251.4
申请日:2022-12-23
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F18/241 , G06F18/214 , G06N3/04 , G06N3/08
摘要: 本发明提出一种神经网络模型训练方法及装置,其中,方法包括:通过基于待训练的神经网络模型,确定对应的样本评分模型,进而采用样本集中的训练样本,对样本评分模型与神经网络模型同步进行多个轮次的分类任务训练。根据多个轮次的分类任务训练过程中,样本评分模型对样本集中的训练样本基于训练损失所预测的训练难度分值,以及训练难度分值的变化量,对样本集中的训练样本进行筛选,以便将筛选保留的训练样本用于该神经网络模型在多个轮次之后的后续分类任务训练。
-
公开(公告)号:CN115908933A
公开(公告)日:2023-04-04
申请号:CN202211541994.9
申请日:2022-12-02
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0895
摘要: 本公开提供了一种半监督分类模型训练方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:对获取的素材样本进行序列化处理,得到素材序列;对素材序列进行随机掩码处理,得到包括整体语义特征的掩码序列;将素材序列和掩码序列输入预先构建的半监督分类网络的掩码预测网络中,计算得到掩码预测网络的掩码预测损失;将带目标标签且经过掩码预测网络预测的整体语义特征输入半监督分类网络的线性分类网络,计算得到线性分类网络的监督损失;基于掩码预测损失和监督损失,训练半监督分类网络,得到对应半监督分类网络的半监督分类模型。该实施方式提高了半监督分类模型的分类性能。
-
-
-
-