一种图神经网络的预训练方法及装置

    公开(公告)号:CN114819139A

    公开(公告)日:2022-07-29

    申请号:CN202210315789.4

    申请日:2022-03-28

    IPC分类号: G06N3/08 G06N3/04

    摘要: 本说明书实施例提供一种图神经网络的预训练方法及装置,获取业务关系图的图集合,各业务关系图中的节点表示业务对象,连接边表示业务关联关系;图集合包括第一图和目标图,第一图和目标图基于同一样本业务关系图分别进行预设增强处理而得到;针对第一图,分别将图集合中各其他图作为第二图,利用图神经网络进行图间匹配表征,图间匹配表征包括,基于第一图自身,结合来自第二图的节点信息,确定该第一图的第一图表征,用于表示第一图相对于第二图的业务结构关联;基于第二图自身,结合来自第一图的节点信息,确定该第二图的第二图表征;至少基于将目标图作为第二图时得到的第一图表征和第二图表征,确定第一损失;根据第一损失,训练图神经网络。

    一种样本生成方法、装置以及设备

    公开(公告)号:CN114781488A

    公开(公告)日:2022-07-22

    申请号:CN202210295588.2

    申请日:2022-03-24

    IPC分类号: G06K9/62

    摘要: 本说明书实施例公开了一种样本生成方法、装置以及设备。方案包括:根据物品特征,以及用户对物品特征的注意力特征,通过模型预测第一样本用户对第一物品的第一偏好分和对第二物品的第二偏好分,第一偏好分高于第二偏好分;根据设定的注意力扰动参数,对第一样本用户的注意力特征进行调整,并根据调整后的注意力特征,对第一偏好分和第二偏好数据进行更新;以减小更新后的第一偏好分与第二偏好分之间的差距为目标,学习注意力扰动参数的目标取值;在目标取值下,若更新后的第一偏好分低于第二偏好分,则根据调整后的注意力特征,生成第二样本用户,用于训练模型。

    基于样本特征的有向关联关系的随机森林训练方法及装置

    公开(公告)号:CN115034330B

    公开(公告)日:2024-10-29

    申请号:CN202210741054.8

    申请日:2022-06-27

    发明人: 李龙飞 周俊

    摘要: 本说明书实施例提供了基于样本特征的有向关联关系的随机森林训练方法及随机森林训练装置。在该随机森林训练方法中,基于经过打标的多个训练样本进行针对样本特征的结构学习,得到由该多个训练样本的样本特征以及样本标记作为节点构成的DAG;根据DAG中的样本标记节点从DAG中抽取由样本特征节点构成的有向关联路径,该有向关联路径中的各个样本特征节点按序有向连接;基于所抽取的有向关联路径来训练决策树;以及基于训练得到的决策树构建随机森林。

    用于多机构的风险预测模型的训练、预测方法和装置

    公开(公告)号:CN118822711A

    公开(公告)日:2024-10-22

    申请号:CN202410797777.9

    申请日:2024-06-19

    摘要: 本说明书实施例提供一种用于多机构的风险预测模型的训练、预测方法和装置。训练方法包括:分布式系统内的任一工作节点获取目标机构对应的一批样本构成的目标样本集,样本包括目标机构的样本用户的用户特征和样本用户的风险标签;在第一阶段,根据目标样本集,与其他工作节点联合确定多个机构对应的多个风险预测模型的元基础参数;多个风险预测模型具有共享的特征表示网络,任一风险预测模型具有对应机构专用的预测网络;在第二阶段,根据目标样本集,在元基础参数的基础上,调整目标机构的目标风险预测模型中预测网络的专属参数。

    基于文本语料生成医疗知识图谱的方法及装置

    公开(公告)号:CN118152590A

    公开(公告)日:2024-06-07

    申请号:CN202410564986.9

    申请日:2024-05-08

    摘要: 本说明书实施例提供一种基于文本语料生成医疗知识图谱的方法及装置,在基于文本语料构建知识图谱时,可以将知识图谱的数据获取过程分为开放式抽取和对齐两个阶段。具体而言,先由大模型从原始文本语料中开放式抽取实体词及相应的实体类型,还根据所抽取的实体词和实体类型提取相应连接关系。之后,再按照预先定义的实体模式和连接模式进行实体和关系的对齐,并根据对齐结果构建知识图谱。如此,可以提高知识图谱构建的全面性和有效性。

    基于医疗知识库的查询处理方法和装置

    公开(公告)号:CN118132680A

    公开(公告)日:2024-06-04

    申请号:CN202410545207.0

    申请日:2024-04-30

    摘要: 本说明书实施例提供一种基于医疗知识库的查询处理方法和装置,其中,医疗知识库包括知识图谱,知识图谱中的节点包括标准词节点和词条节点,各词条节点具有对应子图作为其词条索引。方法包括:从查询请求中提取若干医学术语;基于若干医学术语,查询知识图谱,获得关联词查询结果和词条查询结果,关联词查询结果至少包括查询到的标准词节点,词条查询结果包括若干备选词条节点;根据关联词查询结果,确定查询请求与若干备选词条节点各自对应的子图的相关性得分;根据相关性得分,确定出目标词条,将对应的词条内容归入查询处理结果。能够提升查询到的词条的准确率。

    基于可靠集成模型的数据驱动演化优化方法和系统

    公开(公告)号:CN118013854A

    公开(公告)日:2024-05-10

    申请号:CN202410276175.9

    申请日:2024-03-11

    摘要: 本公开提供一种基于可靠集成模型的数据驱动演化优化方法和系统,包括:获得待优化任务,对待优化任务进行迭代,得到并输出待优化任务的目标解,在第m次迭代的情况下:将第m次迭代的候选解集输入至预设的N个基模型中的每一基模型,得到各基模型各自的预测目标值,m为大于等于1的整数,N为大于1的整数,基于第m次迭代的各预测目标值对N个基模型进行可靠性集成,得到第m次迭代的候选解集的可靠性评估值,根据第m次迭代的候选解集的可靠性评估值确定第m+1次迭代的候选解集,以提供准确而鲁棒的候选解集的可靠性评估值,搜索潜在的相对更优解,使更可靠的基模型对指导优化算法做出更多贡献,更加稳定且准确地推动优化算法的进行。