-
公开(公告)号:CN115099988B
公开(公告)日:2024-10-15
申请号:CN202210753985.X
申请日:2022-06-28
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开一种模型训练方法、数据处理方法、设备及计算机介质,可应用于金融风控、人工智能等各种场景。模型训练方法包括:获取第一样本集合;获取辅助模型、多个参考模型,以及多个无标记样本特征信息;基于第一样本集合、辅助模型,以及多个参考模型对初始元教师模型进行训练,得到目标元教师模型;利用多个无标记样本特征信息、多个参考模型,以及目标元教师模型确定多个无标记样本特征信息对应的多个样本评价指数标记;根据多个无标记样本特征信息、多个样本评价指数标记,对初始学生模型进行训练,得到对应的目标学生模型。本申请提供的模型训练方法训练出的目标学生模型,可融合多个参考模型的风控能力,提高了风控的准确度。
-
公开(公告)号:CN117350366A
公开(公告)日:2024-01-05
申请号:CN202311341516.8
申请日:2023-10-13
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开了一种网络模型构建方法以及相关设备,可以获取构建网络模型所需的参考样本;通过预设选择网络模型,对样本库中的多个样本进行样本选择处理,得到从所述样本库中筛选出的与所述参考样本相似的多个目标样本;通过所述预设选择网络模型,对所述专家模型库中的多个专家模型进行样本选择处理,得到从所述专家模型库中筛选出的所述训练样本与所述参考样本相似的多个目标专家模型;通过知识蒸馏处理,学习多个所述目标专家模型的模型信息,以得到融合后专家模型;基于所述参考样本以及所述目标样本,对所述融合后专家模型进行网络模型训练,得到训练后的目标网络模型。本申请可以提高网络模型的泛化性,增强网络模型效果。
-
公开(公告)号:CN118628225A
公开(公告)日:2024-09-10
申请号:CN202310262417.4
申请日:2023-03-09
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06Q40/03 , G06Q10/0639 , G06F18/22 , G06F18/214 , G06Q10/04 , G06N3/0464 , G06N3/08
摘要: 一种风险评估模型的训练方法、装置、设备及存储介质,涉及AI技术领域。该方法包括:获取M个标注有风险评估结果的有标签样本,以及N个未标注有风险评估结果的拒绝样本;根据拒绝样本对应的对象属性信息以及各个有标签样本分别对应的对象属性信息,确定拒绝样本与各个有标签样本之间的相似度;从M个有标签样本中,选择相似度满足条件的有标签样本,作为拒绝样本对应的增强样本;根据各个增强样本分别对应的对象属性信息和标注的风险评估结果,对风险评估模型进行训练,得到完成训练的风险评估模型。通过上述方法,采用增强样本替代拒绝样本,对风险评估模型进行训练,避免了有偏估计的问题,提高了风险评估的准确性。
-
公开(公告)号:CN118094280A
公开(公告)日:2024-05-28
申请号:CN202211500167.5
申请日:2022-11-28
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F18/24 , G06F18/214 , G06F18/25 , G06N3/0464 , G06N3/0985
摘要: 本申请公开了一种对象分类预测方法、装置、设备、介质及程序产品,涉及人工智能领域。该方法包括:获取多个历史行为数据和多个候选模型的模型参数;基于历史行为数据确定至少两个分类类别分别对应的质心特征表示;基于第i个分类类别对应的质心特征表示对多个候选模型的模型参数进行参数融合,得到与第i个分类类别对应的第一参数;将第i个分类类别对应的质心特征表示表征的特征分布情况转化为第i个分类类别对应的第二参数;对第一参数和第二参数进行参数融合,得到第i个分类类别对应的目标参数,并基于各分类类别对应的目标参数构建分类预测网络。该方法提高了在冷启动阶段中所使用的分类预测网络进行分类预测时的准确度。
-
公开(公告)号:CN118709751A
公开(公告)日:2024-09-27
申请号:CN202310306485.6
申请日:2023-03-27
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06N3/096 , G06N3/098 , G06N3/0985 , G06N3/045 , H04L67/10
摘要: 本申请提供一种资源处理网络训练方法、资源处理方法及装置,应用于人工智能等各种场景,该方法包括:从服务器获取教师网络;基于至少两个业务网络、教师网络和支持样本资源训练第一学生网络,基于训练结果对查询样本资源进行资源评价,并根据资源评价处理结果确定教师网络的更新梯度;发送更新梯度至服务器,以使服务器基于每个参与客户端发送的更新梯度更新教师网络,得到目标教师网络;以及以使服务器传输目标教师网络至目标客户端;以及以使目标客户端基于至少两个业务网络、目标教师网络和预设业务场景下的目标无标签样本资源训练第二学网络,得到目标学生网络。本申请能够提高预设业务场景在业务冷启动阶段无标记样本的建模便捷性。
-
公开(公告)号:CN118690182A
公开(公告)日:2024-09-24
申请号:CN202411189593.0
申请日:2024-08-28
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F18/213 , G06Q40/03 , G06N3/096 , G06N3/0455 , G06N3/0895
摘要: 本申请实施例公开了数据处理方法、装置及相关设备,可应用于数据处理技术领域。其中方法包括:对目标对象的目标关联数据进行向量特征提取,得到目标关联数据对应的嵌入向量特征;对嵌入向量特征进行特征提取处理,得到目标提取特征;确定与目标关联数据相关联的N个业务场景,基于每个业务场景对目标提取特征分别进行风险预估处理,得到每个业务场景对应的风险预估概率;对嵌入向量特征进行权重提取处理,得到每个业务场景对应的权重影响值;基于每个业务场景对应的风险预估概率和每个业务场景对应的权重影响值,确定目标对象的风险识别概率。采用本申请实施例,有助于提升风险识别的准确性。
-
公开(公告)号:CN117312934A
公开(公告)日:2023-12-29
申请号:CN202210700977.9
申请日:2022-06-20
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F18/241 , G06F18/25 , G06N5/022 , G06F18/22
摘要: 本申请公开了一种分类方法、装置、设备、存储介质及产品,属于人工智能技术领域。上述方法包括:获取至少两个分类模型,上述至少两个分类模型各自对应的业务场景均与目标模型对应的业务场景相关;获取上述业务场景下无标注的、用户账户相关的训练数据;根据上述训练数据,对上述至少两个分类模型中的每一分类模型的知识进行基于相关度的知识蒸馏,训练上述目标模型,上述相关度表征上述每一分类模型与上述目标模型的相关程度;获取上述业务场景下的目标账户,将上述目标账户输入训练后的目标模型,得到上述目标账户对应的分类结果。本申请实施例可以在无标注场景下,依赖相关多个非冷启动状态模型,通过知识蒸馏的方式提升用于进行用户账户分类的模型的冷启动效果。
-
公开(公告)号:CN117216563A
公开(公告)日:2023-12-12
申请号:CN202311177740.8
申请日:2023-09-12
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F18/214 , G06F18/241 , G06N20/00
摘要: 本申请实施例提供了一种样本信息更新方法、装置、电子设备及存储介质,方法包括:根据各目标域样本对应的样本标签和分类模型在第i轮迭代针对各目标域样本输出的第二预测结果,确定第i轮迭代对应的目标占比;根据各源域样本在第i轮迭代对应的参考标签和分类模型在第i轮迭代针对各源域样本输出的第一预测结果,确定各源域样本在第i轮迭代对应的预测误差;基于各源域样本在第i轮迭代对应的预测误差和第i轮迭代对应的目标占比对源域样本的样本信息中的样本标签进行更新。通过采用上述方法,可以实现基于目标于样本的样本标签对对源域样本的样本标签进行更新以提升该源域样本的样本标签用作对目标模型的训练时的准确性。
-
公开(公告)号:CN116975753A
公开(公告)日:2023-10-31
申请号:CN202310231183.7
申请日:2023-03-01
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F18/2431 , G06F18/214 , G06Q40/02 , G06Q40/03
摘要: 本申请提供了一种基于数据类别预测方法、装置、设备和介质,用于提高数据类别预测的准确率。该方法包括:获取训练样本集合中的初始样本数据和初始样本数据在第t次训练时的第一分类权重,根据第一分类权重对初始样本数据进行加权处理,得到第t次训练的第一加权样本数据;通过初始分类模型输出第一加权样本数据对应的第一类别预测结果,根据第一类别预测结果、第一分类权重和初始样本数据对应的类别标签信息,确定初始分类模型的第一损失;根据第一损失对第一分类权重和初始分类模型进行修正,得到第t次训练的第二分类权重和候选分类模型,根据第t次训练的第二分类权重和候选分类模型得到目标分类模型;目标分类模型用于预测目标数据所属的类别。
-
公开(公告)号:CN115099988A
公开(公告)日:2022-09-23
申请号:CN202210753985.X
申请日:2022-06-28
申请人: 腾讯科技(深圳)有限公司
摘要: 本申请公开一种模型训练方法、数据处理方法、设备及计算机介质,可应用于金融风控、人工智能等各种场景。模型训练方法包括:获取第一样本集合;获取辅助模型、多个参考模型,以及多个无标记样本特征信息;基于第一样本集合、辅助模型,以及多个参考模型对初始元教师模型进行训练,得到目标元教师模型;利用多个无标记样本特征信息、多个参考模型,以及目标元教师模型确定多个无标记样本特征信息对应的多个样本评价指数标记;根据多个无标记样本特征信息、多个样本评价指数标记,对初始学生模型进行训练,得到对应的目标学生模型。本申请提供的模型训练方法训练出的目标学生模型,可融合多个参考模型的风控能力,提高了风控的准确度。
-
-
-
-
-
-
-
-
-