-
公开(公告)号:CN104899156B
公开(公告)日:2017-11-14
申请号:CN201510229346.3
申请日:2015-05-07
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F12/06
Abstract: 本发明公开了一种面向大规模社交网络的图数据存储及查询方法,本发明数据存储管理器对收到的图数据采用Key‑Value方式存储,以图数据的顶点ID为Key,以顶点邻域为Value;对每一顶点邻域的数据存储:将与该顶点邻域相连的多条边以时间戳有序存储到固定大小的内存块中,并构成双向链表,将该顶点的属性信息和索引信息存储到一数据结构中。当数据存储管理器收到访问顶点v的访问请求时,数据存储管理器将该顶点v及其k阶邻域传输给请求者;请求者将返回数据缓存在本地,下次查询时,首先检查本地的缓存,如果不存在查询的顶点,则将访问请求发送给所述数据存储管理器。本发明能满足动态更新、适合处理数据稀疏的场景和随机访问。
-
公开(公告)号:CN104899156A
公开(公告)日:2015-09-09
申请号:CN201510229346.3
申请日:2015-05-07
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F12/06
Abstract: 本发明公开了一种面向大规模社交网络的图数据存储及查询方法,本发明数据存储管理器对收到的图数据采用Key-Value方式存储,以图数据的顶点ID为Key,以顶点邻域为Value;对每一顶点邻域的数据存储:将与该顶点邻域相连的多条边以时间戳有序存储到固定大小的内存块中,并构成双向链表,将该顶点的属性信息和索引信息存储到一数据结构中。当数据存储管理器收到访问顶点v的访问请求时,数据存储管理器将该顶点v及其k阶邻域传输给请求者;请求者将返回数据缓存在本地,下次查询时,首先检查本地的缓存,如果不存在查询的顶点,则将访问请求发送给所述数据存储管理器。本发明能满足动态更新、适合处理数据稀疏的场景和随机访问。
-
公开(公告)号:CN103593433A
公开(公告)日:2014-02-19
申请号:CN201310559846.4
申请日:2013-11-12
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30604 , G06F17/3089
Abstract: 本发明涉及一种面向海量时序数据的图数据处理方法及系统,预处理社交网络数据,并抽象出以顶点代表人物,以若干条带有时间戳的边代表人物间互动关系的图结构;该表示方法能够有效的表示有互动时序关系的社交网络关系;根据名人效应将图结构按照预定的欧式距离切分成若干个图结构块,并给图结构块及其内部的顶点编号;按照内存组织方式将图结构块导入内存的相应位置中;该内存存储方式充分利用了图数据的分布特性,能达到高效的存储和查询性能;本发明本着节省计算时间和内存空间的原则,改进了原始以顶点为计算单元的编程模型,而是采用以消息为计算单元的编程模型,这种方式在很大程度上节省了计算时间,也节约了存储空间。
-
公开(公告)号:CN103593433B
公开(公告)日:2016-11-02
申请号:CN201310559846.4
申请日:2013-11-12
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种面向海量时序数据的图数据处理方法及系统,预处理社交网络数据,并抽象出以顶点代表人物,以若干条带有时间戳的边代表人物间互动关系的图结构;该表示方法能够有效的表示有互动时序关系的社交网络关系;根据名人效应将图结构按照预定的欧式距离切分成若干个图结构块,并给图结构块及其内部的顶点编号;按照内存组织方式将图结构块导入内存的相应位置中;该内存存储方式充分利用了图数据的分布特性,能达到高效的存储和查询性能;本发明本着节省计算时间和内存空间的原则,改进了原始以顶点为计算单元的编程模型,而是采用以消息为计算单元的编程模型,这种方式在很大程度上节省了计算时间,也节约了存储空间。
-
-
-