Invention Publication
- Patent Title: 一种模型训练方法及相关设备
-
Application No.: CN202211182296.4Application Date: 2022-09-27
-
Publication No.: CN115630297APublication Date: 2023-01-20
- Inventor: 戴全宇 , 王磊 , 陈旭 , 董振华 , 唐睿明
- Applicant: 华为技术有限公司 , 中国人民大学
- Applicant Address: 广东省深圳市龙岗区坂田华为总部办公楼;
- Assignee: 华为技术有限公司,中国人民大学
- Current Assignee: 华为技术有限公司,中国人民大学
- Current Assignee Address: 广东省深圳市龙岗区坂田华为总部办公楼;
- Agency: 深圳市深佳知识产权代理事务所
- Agent 李杭
- Main IPC: G06F18/214
- IPC: G06F18/214

Abstract:
一种模型训练方法,涉及人工智能领域,方法包括:获取训练样本以及第一概率分布,训练样本包括多个操作数据,每个操作数据为用户对一个第一物品的操作信息;第一概率分布包括操作数据的多个组合对应的选择概率,第一概率分布用于从多个组合中选择目标组合;根据目标组合,获取第一信息以及第二信息;第一信息表示在选择每个操作数据训练推荐模型时对模型精度的影响能力,第二信息表示将每个操作数据中包含的第一物品公开时的用户敏感度;第一信息、第二信息以及目标组合用于得到奖励值;根据奖励值更新第一概率分布,得到第二概率分布,第二概率分布用于训练推荐模型。本申请可以保证训练后的模型在公开敏感度和模型性能上的平衡。
Information query