-
公开(公告)号:CN114819139A
公开(公告)日:2022-07-29
申请号:CN202210315789.4
申请日:2022-03-28
申请人: 支付宝(杭州)信息技术有限公司 , 中国人民大学
摘要: 本说明书实施例提供一种图神经网络的预训练方法及装置,获取业务关系图的图集合,各业务关系图中的节点表示业务对象,连接边表示业务关联关系;图集合包括第一图和目标图,第一图和目标图基于同一样本业务关系图分别进行预设增强处理而得到;针对第一图,分别将图集合中各其他图作为第二图,利用图神经网络进行图间匹配表征,图间匹配表征包括,基于第一图自身,结合来自第二图的节点信息,确定该第一图的第一图表征,用于表示第一图相对于第二图的业务结构关联;基于第二图自身,结合来自第一图的节点信息,确定该第二图的第二图表征;至少基于将目标图作为第二图时得到的第一图表征和第二图表征,确定第一损失;根据第一损失,训练图神经网络。
-
公开(公告)号:CN114781488A
公开(公告)日:2022-07-22
申请号:CN202210295588.2
申请日:2022-03-24
申请人: 支付宝(杭州)信息技术有限公司 , 中国人民大学
IPC分类号: G06K9/62
摘要: 本说明书实施例公开了一种样本生成方法、装置以及设备。方案包括:根据物品特征,以及用户对物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,第一偏好分高于第二偏好分;根据设定的注意力扰动参数,对第一样本用户的注意力特征进行调整,并根据调整后的注意力特征,对第一偏好分和第二偏好数据进行更新;以减小更新后的第一偏好分与第二偏好分之间的差距为目标,学习注意力扰动参数的目标取值;在目标取值下,若更新后的第一偏好分低于第二偏好分,则根据调整后的注意力特征,生成第二样本用户,用于训练模型。
-
公开(公告)号:CN115034330B
公开(公告)日:2024-10-29
申请号:CN202210741054.8
申请日:2022-06-27
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F18/2431 , G06N20/00 , G06F18/214
摘要: 本说明书实施例提供了基于样本特征的有向关联关系的随机森林训练方法及随机森林训练装置。在该随机森林训练方法中,基于经过打标的多个训练样本进行针对样本特征的结构学习,得到由该多个训练样本的样本特征以及样本标记作为节点构成的DAG;根据DAG中的样本标记节点从DAG中抽取由样本特征节点构成的有向关联路径,该有向关联路径中的各个样本特征节点按序有向连接;基于所抽取的有向关联路径来训练决策树;以及基于训练得到的决策树构建随机森林。
-
公开(公告)号:CN118822711A
公开(公告)日:2024-10-22
申请号:CN202410797777.9
申请日:2024-06-19
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06Q40/03 , G06N3/045 , G06N3/0985 , G06N3/096
摘要: 本说明书实施例提供一种用于多机构的风险预测模型的训练、预测方法和装置。训练方法包括:分布式系统内的任一工作节点获取目标机构对应的一批样本构成的目标样本集,样本包括目标机构的样本用户的用户特征和样本用户的风险标签;在第一阶段,根据目标样本集,与其他工作节点联合确定多个机构对应的多个风险预测模型的元基础参数;多个风险预测模型具有共享的特征表示网络,任一风险预测模型具有对应机构专用的预测网络;在第二阶段,根据目标样本集,在元基础参数的基础上,调整目标机构的目标风险预测模型中预测网络的专属参数。
-
公开(公告)号:CN118379114A
公开(公告)日:2024-07-23
申请号:CN202410621838.6
申请日:2024-05-17
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06Q30/0601 , G06N3/042 , G06N3/08 , G06N5/022
摘要: 本说明书实施例提供一种图神经网络的训练及商品推送的技术方案,在进行商品推送过程中引入知识图谱,而为了训练用于处理知识图谱的图神经网络,引入用户意图、商品原型,以及用户意图和商品原型之间的决策路径。如此,基于经由用户意图优化的用户表征、经由商品原型优化的商品表征、决策路径数量、偏好预测的损失共同确定预测损失,如此训练的图神经网络可以携带用户意图和路径决策信息,从而更准确地进行信息推送。
-
公开(公告)号:CN118332339A
公开(公告)日:2024-07-12
申请号:CN202410502447.2
申请日:2024-04-24
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F18/214 , G06F18/22 , G06F40/284 , G06F40/30 , G06F40/289
摘要: 本说明书实施例提供一种映射模型的训练方法及装置,该训练方法包括:首先,获取用户行为涉及的对象标识集,其中任一的目标对象标识关联描述目标对象的真实词元序列;接着,利用映射模型确定所述目标对象标识对应的目标表征向量及相关词元信息;然后,利用训练好的大语言模型处理所述目标表征向量,得到预测词元序列;之后,以所述预测词元序列趋同于所述真实词元序列为目标,训练所述映射模型。
-
公开(公告)号:CN118152590A
公开(公告)日:2024-06-07
申请号:CN202410564986.9
申请日:2024-05-08
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F16/36 , G06F16/35 , G06F40/284 , G06N5/022
摘要: 本说明书实施例提供一种基于文本语料生成医疗知识图谱的方法及装置,在基于文本语料构建知识图谱时,可以将知识图谱的数据获取过程分为开放式抽取和对齐两个阶段。具体而言,先由大模型从原始文本语料中开放式抽取实体词及相应的实体类型,还根据所抽取的实体词和实体类型提取相应连接关系。之后,再按照预先定义的实体模式和连接模式进行实体和关系的对齐,并根据对齐结果构建知识图谱。如此,可以提高知识图谱构建的全面性和有效性。
-
公开(公告)号:CN118132680A
公开(公告)日:2024-06-04
申请号:CN202410545207.0
申请日:2024-04-30
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F16/33 , G06F16/31 , G06F16/36 , G06F40/247 , G06F40/284 , G16H50/70 , G06N5/022
摘要: 本说明书实施例提供一种基于医疗知识库的查询处理方法和装置,其中,医疗知识库包括知识图谱,知识图谱中的节点包括标准词节点和词条节点,各词条节点具有对应子图作为其词条索引。方法包括:从查询请求中提取若干医学术语;基于若干医学术语,查询知识图谱,获得关联词查询结果和词条查询结果,关联词查询结果至少包括查询到的标准词节点,词条查询结果包括若干备选词条节点;根据关联词查询结果,确定查询请求与若干备选词条节点各自对应的子图的相关性得分;根据相关性得分,确定出目标词条,将对应的词条内容归入查询处理结果。能够提升查询到的词条的准确率。
-
公开(公告)号:CN118013854A
公开(公告)日:2024-05-10
申请号:CN202410276175.9
申请日:2024-03-11
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06F30/27 , G06F18/214 , G06F119/02
摘要: 本公开提供一种基于可靠集成模型的数据驱动演化优化方法和系统,包括:获得待优化任务,对待优化任务进行迭代,得到并输出待优化任务的目标解,在第m次迭代的情况下:将第m次迭代的候选解集输入至预设的N个基模型中的每一基模型,得到各基模型各自的预测目标值,m为大于等于1的整数,N为大于1的整数,基于第m次迭代的各预测目标值对N个基模型进行可靠性集成,得到第m次迭代的候选解集的可靠性评估值,根据第m次迭代的候选解集的可靠性评估值确定第m+1次迭代的候选解集,以提供准确而鲁棒的候选解集的可靠性评估值,搜索潜在的相对更优解,使更可靠的基模型对指导优化算法做出更多贡献,更加稳定且准确地推动优化算法的进行。
-
公开(公告)号:CN117371517A
公开(公告)日:2024-01-09
申请号:CN202311367619.1
申请日:2023-10-20
申请人: 支付宝(杭州)信息技术有限公司
IPC分类号: G06N3/0985 , G06N3/084 , G06F18/214 , G06V10/774 , G06T1/20
摘要: 本说明书提供一种深度学习模型的元学习方法以及深度学习模型的元学习系统,涉及深度学习技术领域。该深度学习模型的元学习方法应用于包括N个处理节点的集群,其中,该方法包括:获得训练数据集,上述训练数据集包括多个任务对应的训练样本;以及,通过上述集群中的N个处理节点并行地基于上述训练数据集对上述深度学习模型进行多次迭代训练,得到该深度学习模型的元学习参数。其中,在每次迭代训练中,上述N个处理节点中的每个处理节点使用训练数据集中的部分训练样本学习该深度学习模型的部分参数,上述部分训练样本对应于同一任务。
-
-
-
-
-
-
-
-
-