-
公开(公告)号:CN109063089A
公开(公告)日:2018-12-21
申请号:CN201810836811.3
申请日:2018-07-26
申请人: 清华大学
IPC分类号: G06F17/30
摘要: 本发明公开一种基于社区结构的子图匹配方法及装置,方法包括:导入包含目标模式的文件,分析目标模式结构,找出目标模式中互相匹配等价的子图;根据网络图数据生成以社区作为结点的超图,计算每个社区中各结点与本社区的邻接社区间的边数;在网络图各社区内部利用预设子图匹配算法找出各社区的与目标模式结构匹配的子图,获得第一匹配结果;在网络图中,基于网络图每个社区中各结点与本社区的各邻接社区间的边数和找出的目标模式中互相匹配等价的子图找出跨社区的与目标模式匹配的子图,获得第二匹配结果;将第一、二匹配结果汇总获得最终子图匹配结果。可提高子图匹配速度,减少时间开销。
-
公开(公告)号:CN114730638A
公开(公告)日:2022-07-08
申请号:CN202180006088.6
申请日:2021-04-06
申请人: 清华大学 , 百度在线网络技术(北京)有限公司
IPC分类号: G16H50/70
摘要: 本公开提出一种跨医疗数据源的网络表示学习算法,包括:S1,生成包括源网络和目标网络的医疗网络数据;S2,从源网络和目标网络随机采样设定数量的节点;S3,得到一个L层的神经网络,并对每一层分别计算源网络和目标网络的结构特征和表达特征,计算源网络和目标网络的网络特征之间的距离损失;S4,得到源网络在L层神经网络的输出,并根据分类损失和距离损失计算损失值,根据反向传播算法更新算法的参数;S5,重复步骤S2‑S4,直至整个算法收敛,使得算法对于疾病分类的准确率在多个迭代内不再上升。本公开考虑了不同医院数据源之间的数据分布不一致问题,通过提取网络的结构信息及节点属性信息、最小化特征距离弥补信息损失,有着广阔的应用空间。
-
公开(公告)号:CN108920676B
公开(公告)日:2021-09-03
申请号:CN201810746263.5
申请日:2018-07-09
申请人: 清华大学
IPC分类号: G06F16/33 , G06F16/335
摘要: 本发明实施例提供一种处理图数据的方法及系统,所述方法包括:接收用户输入的对图数据的处理指令,根据所述处理指令生成表示所述处理指令的语义的中间信息;所述处理指令是依据基于社区结构的图数据库系统的语言进行编写的;解析所述中间信息,并获取解析结果对应的数据处理方式,根据所述数据处理方式和预先存储的图数据的相关信息执行所述处理指令。所述系统执行上述方法。本发明实施例提供的处理图数据的方法及系统,通过接收依据基于社区结构的图数据库系统的语言进行编写的处理指令,生成表示处理指令的语义的中间信息,并解析出对应的数据处理方式,执行该处理指令,能够提高对图数据处理的效率。
-
公开(公告)号:CN108920105B
公开(公告)日:2020-08-04
申请号:CN201810718954.4
申请日:2018-07-03
申请人: 清华大学
摘要: 本发明实施例公开一种基于社区结构的图数据分布式存储方法及装置,能使联系紧密的结点的相关信息尽可能地存储在同一台机器中,减少查询和计算过程中机器间的数据请求,提升查询和计算的效率。方法包括:S1、获取待存储的图数据中包含的结点和社区间的从属关系及结点间的边信息,并基于所述结点和社区间的从属关系及结点间的边信息计算各个社区间的关联度;S2、对于每个社区,根据该社区与其它社区的关联度,按关联度的大小对所述其它社区进行排序得到该社区的关联社区列表;S3、基于所述关联社区列表将所述图数据分配给至少一台机器,根据分配结果将所述图数据存储在对应的机器中。
-
公开(公告)号:CN108959584A
公开(公告)日:2018-12-07
申请号:CN201810744938.2
申请日:2018-07-09
申请人: 清华大学
IPC分类号: G06F17/30
摘要: 本发明实施例提供一种基于社区结构的处理图数据的方法及装置,所述方法包括:获取图数据的处理指令;所述处理指令是依据基于社区结构的图数据库系统的语言进行编写的;根据预先建立的关联关系确定所述图数据所属的目标社区;其中,所述关联关系为预设图数据与其所属的社区之间的从属关系;解析所述处理指令,根据解析结果对所述图数据做基于所述目标社区的处理动作。所述装置执行上述方法。本发明实施例提供的基于社区结构的处理图数据的方法及装置,通过获取依据基于社区结构的图数据库系统的语言进行编写的处理指令,确定图数据所属的目标社区,对处理指令的解析结果做基于目标社区的处理动作,能够提高对图数据处理的效率。
-
公开(公告)号:CN109063089B
公开(公告)日:2021-04-23
申请号:CN201810836811.3
申请日:2018-07-26
申请人: 清华大学
IPC分类号: G06F16/901
摘要: 本发明公开一种基于社区结构的子图匹配方法及装置,方法包括:导入包含目标模式的文件,分析目标模式结构,找出目标模式中互相匹配等价的子图;根据网络图数据生成以社区作为结点的超图,计算每个社区中各结点与本社区的邻接社区间的边数;在网络图各社区内部利用预设子图匹配算法找出各社区的与目标模式结构匹配的子图,获得第一匹配结果;在网络图中,基于网络图每个社区中各结点与本社区的各邻接社区间的边数和找出的目标模式中互相匹配等价的子图找出跨社区的与目标模式匹配的子图,获得第二匹配结果;将第一、二匹配结果汇总获得最终子图匹配结果。可提高子图匹配速度,减少时间开销。
-
公开(公告)号:CN108920676A
公开(公告)日:2018-11-30
申请号:CN201810746263.5
申请日:2018-07-09
申请人: 清华大学
IPC分类号: G06F17/30
摘要: 本发明实施例提供一种处理图数据的方法及系统,所述方法包括:接收用户输入的对图数据的处理指令,根据所述处理指令生成表示所述处理指令的语义的中间信息;所述处理指令是依据基于社区结构的图数据库系统的语言进行编写的;解析所述中间信息,并获取解析结果对应的数据处理方式,根据所述数据处理方式和预先存储的图数据的相关信息执行所述处理指令。所述系统执行上述方法。本发明实施例提供的处理图数据的方法及系统,通过接收依据基于社区结构的图数据库系统的语言进行编写的处理指令,生成表示处理指令的语义的中间信息,并解析出对应的数据处理方式,执行该处理指令,能够提高对图数据处理的效率。
-
公开(公告)号:CN108920105A
公开(公告)日:2018-11-30
申请号:CN201810718954.4
申请日:2018-07-03
申请人: 清华大学
摘要: 本发明实施例公开一种基于社区结构的图数据分布式存储方法及装置,能使联系紧密的结点的相关信息尽可能地存储在同一台机器中,减少查询和计算过程中机器间的数据请求,提升查询和计算的效率。方法包括:S1、获取待存储的图数据中包含的结点和社区间的从属关系及结点间的边信息,并基于所述结点和社区间的从属关系及结点间的边信息计算各个社区间的关联度;S2、对于每个社区,根据该社区与其它社区的关联度,按关联度的大小对所述其它社区进行排序得到该社区的关联社区列表;S3、基于所述关联社区列表将所述图数据分配给至少一台机器,根据分配结果将所述图数据存储在对应的机器中。
-
公开(公告)号:CN117648580A
公开(公告)日:2024-03-05
申请号:CN202311370393.0
申请日:2023-10-20
申请人: 北京京东世纪贸易有限公司 , 清华大学
摘要: 本公开提出一种识别家庭账号的方法和装置,涉及计算机领域。该方法包括:获取账号集中的每个账号的待分析信息,所述待分析信息包括:帐号间代买关系信息、帐号间代买行为发生时间、账号所属用户出现的位置信息和时间;根据账号集中的各个账号的帐号间代买关系信息和帐号间代买行为发生时间,确定第一账号间关系信息;根据账号集中的各个账号所属用户出现的位置信息和时间,确定第二账号间关系信息;根据第一账号间关系信息和第二账号间关系信息,确定账号集中任一第一账号相关的第三账号间关系信息;根据第一账号相关的第三账号间关系信息,识别第一账号是否为家庭账号,得到第一识别结果,可以提高家庭账号的识别效果。
-
公开(公告)号:CN108959584B
公开(公告)日:2023-02-10
申请号:CN201810744938.2
申请日:2018-07-09
申请人: 清华大学
IPC分类号: G06F16/901 , G06F16/903
摘要: 本发明实施例提供一种基于社区结构的处理图数据的方法及装置,所述方法包括:获取图数据的处理指令;所述处理指令是依据基于社区结构的图数据库系统的语言进行编写的;根据预先建立的关联关系确定所述图数据所属的目标社区;其中,所述关联关系为预设图数据与其所属的社区之间的从属关系;解析所述处理指令,根据解析结果对所述图数据做基于所述目标社区的处理动作。所述装置执行上述方法。本发明实施例提供的基于社区结构的处理图数据的方法及装置,通过获取依据基于社区结构的图数据库系统的语言进行编写的处理指令,确定图数据所属的目标社区,对处理指令的解析结果做基于目标社区的处理动作,能够提高对图数据处理的效率。
-
-
-
-
-
-
-
-
-