专利检索 ap:("中国人民大学") AND inv:"戴全宇" 第 1 页

1.

发明公开
一种数据处理方法及相关装置审中-实审

公开(公告)号：CN116401398A

公开(公告)日：2023-07-07

申请号：CN202310229317.1

申请日：2023-02-28

申请人： 华为技术有限公司 , 中国人民大学

发明人： 戴全宇 , 戴孙浩 , 邵宁录 , 朱杰明 , 徐君 , 张骁 , 董振华

IPC分类号： G06F16/635 , G06F16/638 , G06N3/08 , G06N3/0464

摘要： 一种数据处理方法，可以应用于人工智能领域，包括：获取第一序列信息；第一序列信息包括用户发生过交互的多个对象的信息；用户与多个对象中的第二对象之间的交互方式为被动交互；根据第一神经网络，处理第一序列信息，得到用户对第二对象进行交互时的注意力预测值；根据用户的信息以及第二对象的信息，通过推荐模型，得到用户与第二对象对应的推荐信息；根据推荐信息和注意力预测值确定第一损失，其中，注意力预测值在确定第一损失时融合至与第二对象对应的损失项。本申请将预测到的用户注意力与下游推荐任务的损失函数中被动交互样本对应的损失项进行融合(例如加权，从而减少被动交互产生的样本的噪声影响。

2.

发明公开
一种数据处理方法及相关装置审中-实审

公开(公告)号：CN116340616A

公开(公告)日：2023-06-27

申请号：CN202310125180.5

申请日：2023-02-10

申请人： 华为技术有限公司 , 中国人民大学

发明人： 戴全宇 , 张景森 , 陈旭 , 董振华 , 唐睿明

IPC分类号： G06F16/9535 , G06F18/25 , G06F18/24 , G06F18/214 , G06Q10/0639 , G06F30/20 , G06N3/0464 , G06N3/084 , G06F111/04

摘要： 一种数据处理方法，可以应用于人工智能领域，包括：获取对应于目标用户的属性信息的第一特征表示、对应于目标物品的属性信息的第二特征表示以及对应于目标用户对目标物品进行评价的一个特征维度的第三特征表示；通过推荐模型，预测目标用户对目标物品在特征维度下的目标评价；根据第一特征表示、第二特征表示以及第三特征表示，获取第一权重，第一权重表示目标用户对目标物品在特征维度下进行评价的可能性；根据目标评价以及第一权重，构建用于更新推荐模型的损失。本申请中，第一权重可以调整用于更新推荐模型的损失中和评价相关的损失项的大小，因此可以得到一个更为准确的无偏的损失，进而基于该损失训练得到的推荐模型的推荐精度会更高。

3.

发明公开
一种模型训练方法及相关设备审中-实审

公开(公告)号：CN115630297A

公开(公告)日：2023-01-20

申请号：CN202211182296.4

申请日：2022-09-27

申请人： 华为技术有限公司 , 中国人民大学

发明人： 戴全宇 , 王磊 , 陈旭 , 董振华 , 唐睿明

IPC分类号： G06F18/214

摘要： 一种模型训练方法，涉及人工智能领域，方法包括：获取训练样本以及第一概率分布，训练样本包括多个操作数据，每个操作数据为用户对一个第一物品的操作信息；第一概率分布包括操作数据的多个组合对应的选择概率，第一概率分布用于从多个组合中选择目标组合；根据目标组合，获取第一信息以及第二信息；第一信息表示在选择每个操作数据训练推荐模型时对模型精度的影响能力，第二信息表示将每个操作数据中包含的第一物品公开时的用户敏感度；第一信息、第二信息以及目标组合用于得到奖励值；根据奖励值更新第一概率分布，得到第二概率分布，第二概率分布用于训练推荐模型。本申请可以保证训练后的模型在公开敏感度和模型性能上的平衡。

4.

发明公开
一种基于奖励修正的去除注意力偏差的流式音乐推荐方法审中-实审

公开(公告)号：CN115309936A

公开(公告)日：2022-11-08

申请号：CN202210949277.3

申请日：2022-08-09

申请人： 中国人民大学

发明人： 徐君 , 张骁 , 戴孙浩 , 董振华 , 戴全宇 , 文继荣

IPC分类号： G06F16/68 , G06F16/635 , G06N3/04 , G06N3/08

摘要： 本发明通过网络安全领域的方法，实现了一种基于奖励修正的去除注意力偏差的流式音乐推荐方法。方法的核心包含三个模块：奖励修正模型、注意力预测模块、相关性预测模块。奖励修正模块通过重要性采样的方法，结合预测的用户注意力和相关性来获得修正后无偏的奖励；注意力预测模块建模了用户对每一首歌的注意力的概率；相关性预测模块用来预测用户对每一首候选歌曲的偏好，并基于修正后的奖励进行参数更新。本发明以此来消除用户反馈中的注意力偏差获得无偏的奖励并提升模型预测的准确性。