一种面向多点对的独立路径计算方法和系统

    公开(公告)号:CN118312646A

    公开(公告)日:2024-07-09

    申请号:CN202410158275.1

    申请日:2024-02-04

    IPC分类号: G06F16/901 G06F16/903

    摘要: 本发明涉及一种面向多点对的独立路径计算方法和系统。该方法包括:将点对集合S划分为大小相同的子集合,称每个子集合为一组;对于每一组点对求解两条独立路径。所述对于每一组点对求解两条独立路径,包括:为同一组中的所有点对同时进行双向宽度优先搜索,得到第一条路径;为存在第一条路径的每对点对更新其对应的图视图;为存在第一条路径的每对点对在更新的图视图上搜索一条路径,称为第二条路径;为存在第一条路径和第二条路径的每对点对调整第一条路径和第二条路径,得到独立路径。在独立路径领域,本发明能够减少访存和计算开销,减少搜索过程中的重复记录;在多实例共享计算领域,本发明能够减少计算冗余和访存冗余,降低计算开销。

    基于物化视图选择和查询规划的正则路径查询方法和系统

    公开(公告)号:CN118503280A

    公开(公告)日:2024-08-16

    申请号:CN202410680530.9

    申请日:2024-05-29

    申请人: 北京大学

    发明人: 邹磊 庞悦

    摘要: 本发明涉及一种基于物化视图选择和查询规划的正则路径查询方法和系统。该方法包括:给定正则路径查询负载和带边标签的有向图,生成查询负载的多查询计划;选择物化视图以最小化查询负载的总查询代价,并借助所述多查询计划来检测和移除冗余视图;在物化视图选择过程中,对多查询计划进行增量更新;根据多查询计划,借助物化视图执行负载查询。本发明的正则路径查询的物化视图选择更切合应用场景的实际需求,提出的带闭包的AND‑OR有向无环图专门针对多个正则路径查询的查询优化问题,有助于多个正则路径查询的联合优化,并能够实现多个关系型数据库查询的查询优化。

    确定图数据中结点构成三角形结构个数的方法及系统

    公开(公告)号:CN113742430B

    公开(公告)日:2024-03-29

    申请号:CN202110893175.X

    申请日:2021-08-04

    申请人: 北京大学

    发明人: 邹磊 林殷年

    IPC分类号: G06F16/28 G06F16/36 G06F7/50

    摘要: 本申请公开了一种确定图数据中结点构成三角形结构个数的方法及系统,属于互联网技术领域。该方法包括:基于各结点对应第一邻居结点的数目,为各结点分配编号;基于图数据中每个边连接两个结点对应编号的大小,确定每个边的第一方向;确定任一结点所连接边的第一方向指向的其他结点,将其他结点确定为任一结点的第二邻居结点;对于任一边连接的两个结点,确定两个结点是否都存在对应的第二邻居结点,如果都存在,则确定各任务结点对中两个结点对应的相同第二邻居结点的目标数目,将每个任务结点对应的目标数目之和,确定为图数据中由结点组成的三角形结构的个数。采用本申请,能够提高在图数据中确定结点构成三角形结构个数的效率。

    图挖掘算法的实现方法和计算机设备

    公开(公告)号:CN116974745A

    公开(公告)日:2023-10-31

    申请号:CN202310410551.4

    申请日:2023-04-17

    申请人: 北京大学

    发明人: 邹磊 胡琳

    IPC分类号: G06F9/50

    摘要: 本公开公开了一种图挖掘算法的实现方法和计算机,属于计算机技术领域。所述方法包括:基于预设图挖掘算法,确定当前的迭代次数对应的迭代处理所需的参考节点;获取存储在内存中的多个参考节点对应的邻接表;基于预设图挖掘算法和多个参考节点对应的邻接表进行当前的迭代次数对应的迭代处理,得到中间输出子图;将中间输出子图发送至内存中进行存储;确定是否满足迭代结束条件,若满足,则将当前的迭代次数对应的中间输出子图确定为输出数据,若不满足,则将当前的迭代次数加一,转至执行确定当前的迭代次数对应的迭代处理所需的参考节点的步骤。采用本公开,增大了GPU能够处理的数据图的规模,提高了图挖掘算法的应用范围。

    子图查询方法
    6.
    发明授权

    公开(公告)号:CN108121788B

    公开(公告)日:2020-08-07

    申请号:CN201711375508.X

    申请日:2017-12-19

    申请人: 北京大学

    发明人: 李友焕 邹磊

    IPC分类号: G06F16/583

    摘要: 本发明公开了一种子图查询方法,属于计算机技术领域。所述方法包括:获取查询图,所述查询图的边集存在时序关系;基于时间窗口,获取图数据流当前的快照;基于所述查询图和所述快照,获取所述查询图当前的扩展链表,所述扩展链表包括多个链表节点,所述多个链表节点中L^i用于存储Ω(Preq(e_i));根据所述扩展链表,获取所述查询图的匹配解,所述查询图的匹配解满足时序匹配条件。本发明考虑到查询图的时序特征,保证得到的匹配解与查询图之间时序匹配,提高了子图查询过程的准确性。

    一种基于交互的知识图谱问答Q/A系统检索提升方法和装置

    公开(公告)号:CN107451240B

    公开(公告)日:2019-12-13

    申请号:CN201710620427.5

    申请日:2017-07-26

    申请人: 北京大学

    发明人: 张欣勃 邹磊

    IPC分类号: G06F16/332 G06F16/36

    摘要: 本公开是关于一种基于交互的知识图谱问答Q/A系统检索提升方法和装置,属于软件技术领域。所述方法包括:通过Q/A系统将用户输入的目标问题映射成BGP图,基于BGP图生成并展示回答信息;获取用户针对回答信息输入的正确答案;确定与正确答案相应的答案图,其中,答案图由以正确答案为主体,向外围扩展的预设数量以内的边涉及的多个三元组实体所构成,边为三元组实体包含的边;基于多种预设的修改方式,分别对BGP图进行预定次数内的修改,得到多个修改BGP图;在多个修改BGP图中确定与答案图相匹配的目标修改BGP图,基于目标修改BGP图,对目标问题包含的短语在映射词典中对应的三元组实体进行修改,其中,映射词典用于存储短语与三元组实体的对应关系。

    一种海量语义数据的存储和查询方法及装置

    公开(公告)号:CN101950297A

    公开(公告)日:2011-01-19

    申请号:CN201010279073.0

    申请日:2010-09-10

    申请人: 北京大学

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种海量语义数据的存储和查询方法及装置,基于云计算搭建具有多个计算机节点的集群,集群包括一个主控节点和若干个从属节点,集群中的每个节点都建立分布式数据库;将海量语义数据通过云计算编程模型导入各节点的分布式数据库,实现了存储的分布式,解决了当处理海量数据时单机系统遇到的存储瓶颈和管理困难的问题,同时,如果数据规模继续扩大,只需要增加集群的从属节点,具有良好的可扩展性。另外,在解决海量数据查询的问题时,本发明方法利用了RMI技术,将查询进行了分割,使得集群的各个节点可以同时处理所得到的分割查询,使得查询速度更快,效率更高。

    基于邻域索引的top-k子图匹配方法和系统

    公开(公告)号:CN118606521A

    公开(公告)日:2024-09-06

    申请号:CN202410792959.7

    申请日:2024-06-19

    申请人: 北京大学

    发明人: 邹磊 杨凌林

    摘要: 本发明属于信息技术领域,涉及一种基于邻域索引的top‑k子图匹配方法和系统。该方法包括:对数据图构建邻域索引,所述邻域索引记录数据图中实体节点在一定跳数邻域内节点属性值的极值;给定查询图,利用邻域索引估计每个子搜索空间能得到的子图匹配结果的分数上界;选择查询初始节点,利用所述间分数上界在结果枚举时剪枝无用的搜索空间,得到top‑k子图匹配的结果。与现有技术需要完整探索所有搜索空间不同,本发明在子搜索空间分数上界的指导下,仅探索必要的搜索空间,减少了计算开销,提升了查询执行的效率,可以用于真实图数据库系统中,帮助大规模图数据分析。

    基于FPGA-CPU异构环境的大规模数据查询加速装置及方法

    公开(公告)号:CN110990638B

    公开(公告)日:2023-04-28

    申请号:CN201911029459.3

    申请日:2019-10-28

    申请人: 北京大学

    IPC分类号: G06F16/901 G06F16/903

    摘要: 本发明公布了一种基于FPGA‑CPU异构环境用于图数据库的大规模数据查询加速方法及其在FPGA上的实现装置,将待查询处理的大规模数据表示为资源描述框架RDF格式的大规模图数据集,基于FPGA‑CPU异构环境实现查询加速,解决在大规模数据集上对数据进行快速的查询的问题,加速图数据库查询,可广泛应用于基于图数据处理的应用技术领域。将该方法应用于自然语言问答智能查询中。实施表明,采用本发明方法,查询加速比例在两倍以上,可达到十倍加速,可以更好地满足对响应时间要求较高的应用需求。