一种模型训练方法及相关设备
Abstract:
一种模型训练方法,涉及人工智能领域,方法包括:获取训练样本以及第一概率分布,训练样本包括多个操作数据,每个操作数据为用户对一个第一物品的操作信息;第一概率分布包括操作数据的多个组合对应的选择概率,第一概率分布用于从多个组合中选择目标组合;根据目标组合,获取第一信息以及第二信息;第一信息表示在选择每个操作数据训练推荐模型时对模型精度的影响能力,第二信息表示将每个操作数据中包含的第一物品公开时的用户敏感度;第一信息、第二信息以及目标组合用于得到奖励值;根据奖励值更新第一概率分布,得到第二概率分布,第二概率分布用于训练推荐模型。本申请可以保证训练后的模型在公开敏感度和模型性能上的平衡。
Patent Agency Ranking
0/0