-
公开(公告)号:CN113609397A
公开(公告)日:2021-11-05
申请号:CN202110934824.6
申请日:2021-08-16
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
发明人: 张美娜
IPC分类号: G06F16/9535 , H04L29/08
摘要: 本公开的实施例公开了用于推送信息的方法和装置。该方法的一具体实施方式包括:获取用户的行为特征向量和属性特征向量,以及分别获取信息集中的各信息的属性特征向量;将用户的行为特征向量输入至预先训练的胶囊网络,生成至少两个用于表征用户的兴趣的胶囊向量;将至少两个胶囊向量分别与用户的属性特征向量进行拼接,以及根据拼接结果,生成至少两个用于表征用户的用户表征向量;确定信息集中的信息的属性特征向量与用户表征向量的匹配度,以及根据确定的匹配度,从信息集中选取信息进行推送。该实施方式有助于捕捉用户更多方面的兴趣,以更全面的进行用户表征。
-
公开(公告)号:CN113822730A
公开(公告)日:2021-12-21
申请号:CN202010770245.8
申请日:2020-08-03
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
发明人: 张美娜
IPC分类号: G06Q30/06 , G06F16/9535 , G06K9/62
摘要: 本公开提供了一种信息的推荐方法,包括:获取离线数据、实时数据和经训练的用户偏好预测模型;从用户的用户特征离线数据中获取用户的用户特征和历史行为统计特征;从用户的用户特征实时数据中获取用户的近期行为序列特征;将用户的用户特征用户特征、历史行为统计特征和近期行为序列特征输入用户的用户特征经训练的用户偏好预测模型,以得到预测结果;以及根据预测结果,生成推荐信息。本公开还提供了一种信息的推荐装置、计算设备及介质。
-
公开(公告)号:CN112925973A
公开(公告)日:2021-06-08
申请号:CN201911243337.4
申请日:2019-12-06
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F16/9535 , G06N20/00
摘要: 本发明公开了一种数据处理方法和装置,涉及计算机技术领域。其中,该方法包括:响应于人群拓展任务的触发,构建用于人群拓展的候选用户集;根据第一提取规则从所述候选用户集中提取部分用户,然后将提取的所述部分用户和种子用户集作为正样本用户;根据第二提取规则提取部分用户作为负样本用户;根据所述正样本用户和负样本用户的用户特征数据对第一机器学习模型进行训练,以得到训练后的第一机器学习模型;根据所述训练后的第一机器学习模型从所述候选用户集中筛选出拓展用户集。通过以上步骤,能够改善人群拓展中机器学习模型的训练效果,提高人群拓展的精准性。
-
公开(公告)号:CN112925973B
公开(公告)日:2024-06-18
申请号:CN201911243337.4
申请日:2019-12-06
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F16/9535 , G06N20/00
摘要: 本发明公开了一种数据处理方法和装置,涉及计算机技术领域。其中,该方法包括:响应于人群拓展任务的触发,构建用于人群拓展的候选用户集;根据第一提取规则从所述候选用户集中提取部分用户,然后将提取的所述部分用户和种子用户集作为正样本用户;根据第二提取规则提取部分用户作为负样本用户;根据所述正样本用户和负样本用户的用户特征数据对第一机器学习模型进行训练,以得到训练后的第一机器学习模型;根据所述训练后的第一机器学习模型从所述候选用户集中筛选出拓展用户集。通过以上步骤,能够改善人群拓展中机器学习模型的训练效果,提高人群拓展的精准性。
-
公开(公告)号:CN113761002A
公开(公告)日:2021-12-07
申请号:CN202110321436.0
申请日:2021-03-25
申请人: 北京沃东天骏信息技术有限公司 , 北京京东世纪贸易有限公司
发明人: 张美娜
IPC分类号: G06F16/2457 , G06F16/2458 , G06Q30/06
摘要: 本申请提供一种信息推送方法、装置、设备和计算机可读存储介质,其中,该方法包括:响应于用户的购物操作,获取用户实时行为序列特征和用户离线特征;将用户实时行为序列特征和用户离线特征输入至预设的离线模型计算得到用户向量;获取预设品牌向量库中与用户向量匹配的品牌向量,将品牌向量所表征的品牌商品的信息推送至用户。该技术方案中,通过用户实时行为序列特征确定用户存在有直接行为的品牌商品,再与用户离线特征结合得到用户向量,并根据用户向量来确定预设品牌向量库中与用户匹配的品牌商品,实现了对用户没有直接行为的预设品牌向量库中的品牌商品的用户偏好进行分析的目的,能够更加全面准确的得到用户的品牌偏好。
-
公开(公告)号:CN112632981A
公开(公告)日:2021-04-09
申请号:CN201910904945.9
申请日:2019-09-24
申请人: 北京京东尚科信息技术有限公司 , 北京京东世纪贸易有限公司
IPC分类号: G06F40/289 , G06F40/295 , G06F40/117 , G06F16/35 , G06F16/36 , G06K9/62
摘要: 本发明公开了一种新词发现方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:基于词库对待分割字符串进行分词处理;对分词处理后的结果进行BIO标注;使用BIO标注后的结果进行无监督训练,用以获取命名实体识别模型;使用所述命名实体识别模型,预测待预测字符串的BIO标注;根据所述待预测字符串的BIO标注合成词语;对比合成的词语与所述待预测字符串的分词处理结果,用以获取新词。该实施方式避免了获取训练样本时大量打标的问题,基于发现的新词提高了分词处理的准确性以及发现新词的效率。
-
-
-
-
-