-
公开(公告)号:CN118312334A
公开(公告)日:2024-07-09
申请号:CN202410419797.2
申请日:2024-04-09
Applicant: 中国科学院计算技术研究所
IPC: G06F9/54 , G06F9/50 , G06F16/901
Abstract: 本发明提供了一种基于外存的图数据单机处理方法,包括:在单个主机中构建冷数据缓冲区和热数据缓冲区,冷数据缓冲区位于所述主机的外存,热数据缓冲区位于所述主机的内存,且被存储于热数据缓冲区的子图设为常驻内存,且不会被外部数据踢出内存;获取包括多个节点和边的图数据,将所述图数据划分为多个子图;将所述子图的存储位置设为所述冷数据缓冲区,并且所述子图的状态设置为激活状态,激活状态表示子图所含的节点和边还需参与处理;由所述主机的处理器基于所述子图进行多次迭代的图处理,在处理子图的过程中记录每次迭代中处于激活状态的子图的处理时间,根据所述处理时间识别出热数据类型的子图,所述热数据类型的子图存于热数据缓冲区。
-
公开(公告)号:CN117971485A
公开(公告)日:2024-05-03
申请号:CN202410161999.1
申请日:2024-02-04
Applicant: 中国科学院计算技术研究所
IPC: G06F9/50 , G06F9/48 , G06F16/901
Abstract: 本发明提出一种针对动态图快照的CPU‑GPU异构并发图处理方法和系统,包括:提取所有图快照的公共子图和每个图快照对应变化的子图,从而形成子图Gs和Gc;将公共子图Gs,依据GPU显存大小和顶点度的属性信息,划分为两部分,分别为Gs0和Gs1,之后将Gs0在初始时一次性拷贝到GPU显存中,Gs1则在迭代处理过程中,按需进行数据重组后,然后以异步多流的方式拷贝到GPU显存中;基于GPU和CPU的计算资源,图处理过程中以顶点为中心,同步迭代方式执行图处理算法。
-
公开(公告)号:CN111737540B
公开(公告)日:2022-11-29
申请号:CN202010460064.5
申请日:2020-05-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/903 , G06F16/901
Abstract: 本发明实施例提供了一种图数据处理方法,包括:S1、获取包含多个顶点的图数据,按顶点的出度由小到大的顺序对顶点排序并将排序序号作为第一重排序ID;S2、根据第一重排序ID将图数据的顶点按预设粒度以轮询方式依次分配到分布式计算节点集群中的每一个分布式计算节点;S3、计算节点使用混合BFS算法对其获得的部分图数据进行遍历,每层遍历后各计算节点得到局部的下一层活跃顶点集;S4、每层遍历后相邻计算节点间进行环形通信以传递局部的下一层活跃顶点集,在部分层遍历后传递局部的下一层活跃顶点集之前,确定本次待传递的局部的下一层活跃顶点集的压缩方式,本发明通过顶点的出度对顶点ID进行重排序、数据压缩和环形通信,提高了通信效率。
-
公开(公告)号:CN117592524A
公开(公告)日:2024-02-23
申请号:CN202311359769.8
申请日:2023-10-19
Applicant: 中国科学院计算技术研究所
IPC: G06N3/0495 , G06N3/063 , G06N3/08
Abstract: 本发明提供一种基于GPU的稀疏深度神经网络的推理加速方法,用于加速所述稀疏深度神经网络对待处理数据的推理过程,所述GPU包括全局内存,所述稀疏深度神经网络包括多层网络层,所述全局内存中存储来自CPU传输的所述稀疏深度神经网络的网络层权重参数,所述方法包括:S1、基于所述全局内存大小、所述待处理数据整体所需内存大小和单层网络层权重参数所需大小,按照预设的分块规则对所述待处理数据进行分块处理得到分块数据,以使每个分块数据均能被完整的存储于全局内存中;S2、将每个分块数据与所述全局内存中存储的网络层权重参数进行计算,直至每个分块数据与所述稀疏深度神经网络的每一网络层权重参数完成计算。
-
公开(公告)号:CN111694643B
公开(公告)日:2023-04-11
申请号:CN202010395810.7
申请日:2020-05-12
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向图神经网络应用的任务调度执行系统及方法,包括:待发射图运算符缓存模块读取待处理图运算符处理请求,根据待处理图运算符处理请求的图运算符标签,从缓存中获取所需输入数据;发射单元将待处理图运算符处理请求和输入数据发送给基于静态数据流的统一结构处理单元;统一结构处理单元根据图运算符标签的图运算符码将输入数据映射到相应的二叉运算树的输入上和图运算符执行帧,并完成本轮运算,得到中间结果;标签生成器依据前一轮运算标签信息,生成新的图运算符标签;统一结构处理单元将中间结果以及新的图运算符标签返回给待发射图运算符缓存模块;循环执行直至图运算符标签中剩余重复次数数值为1,将当前中间结果写回缓存。
-
公开(公告)号:CN115600658A
公开(公告)日:2023-01-13
申请号:CN202211208844.6
申请日:2022-09-30
Applicant: 中国科学院计算技术研究所(CN)
IPC: G06N3/0464 , G06N3/082 , G06N3/047
Abstract: 本发明提供一种应用于图神经网络训练的采样方法,用于在图神经网络训练过程中对图数据进行采样,所述采样方法包括:获取图数据中每个节点的所有邻居节点的存储位置,并以节点的所有邻居节点的存储位置随机排序构成该节点对应的邻居节点序列;基于得到的每个节点对应的邻居节点序列判断该节点的所有邻居节点是否符合集中分布;根据得到的每个节点的邻居节点的判断结果调整该节点被采样的概率,其中,将对应邻居节点符合集中的节点被采样的概率提高,将对应邻居节点不符合集中分布的节点被采样的概率降低;采用调整后的每个节点被采样的概率形成的概率分布对图数据进行采样。本发明减少了采样过程中的访存开销。
-
公开(公告)号:CN114860433A
公开(公告)日:2022-08-05
申请号:CN202210440779.3
申请日:2022-04-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种在模拟器上进行池化计算操作的方法,包括:获取需要池化的图像数据的尺度以及模拟器上可用于本次池化的指定的处理单元的资源信息,其中,所述资源信息至少包括指定的处理单元的个数;根据模拟器上可用于本次池化的指定的处理单元的资源信息对图像数据进行尺度调整,得到调整后的图像数据,以使得对所述调整后的图像数据的池化计算操作能够均衡分布到所述指定的处理单元上;将所述调整后的图像数据均衡分配到模拟器上所述指定的处理单元中执行池化计算操作。
-
公开(公告)号:CN109615116B
公开(公告)日:2020-12-29
申请号:CN201811381191.5
申请日:2018-11-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种电信诈骗事件检测方法和检测系统,其利用构建的电信诈骗事件检测模型来预测诈骗模式。诈骗事件检测模型的构建包括:基于已有的诈骗行为数据建立反映不同时间序列通联模式的动态通联图;基于所述动态通联图挖掘存在诈骗行为的异常子图序列,其中,所述异常子图序列由异常节点、与异常节点关联的节点和边构成;基于所述异常子图序列训练多分类模型,获得用于检测多种诈骗模式的电信诈骗事件检测模型。利用本发明的检测方法和检测系统,能够快速、准确的预测诈骗行为。
-
公开(公告)号:CN112116951A
公开(公告)日:2020-12-22
申请号:CN202010816554.4
申请日:2020-08-14
Applicant: 中国科学院计算技术研究所
IPC: G16B20/00 , G06F16/31 , G06F16/901
Abstract: 本发明实施例提供了一种基于图数据库的蛋白质组数据管理方法、介质和设备,该方法包括:获取蛋白质组对应的图数据,图数据包括多个节点和边,其中,节点记录其所代表的蛋白质,边记录其连接的两个节点间的关系;根据该蛋白质组对应的图数据建立底层的双向链表,该双向链表中的节点按照其所代表蛋白质的名称的字典序依次排列;从底层的双向链表开始,每两个节点提取一个节点到上一层索引以在各索引层建立单向的索引链表,直至顶部的索引链表仅有两个节点,以建立包括多层索引的快速索引;本发明在图数据库原有的基础上建立快速索引,以提高对大规模的蛋白质组的索引效率。
-
公开(公告)号:CN111695685A
公开(公告)日:2020-09-22
申请号:CN202010395809.4
申请日:2020-05-12
Applicant: 中国科学院计算技术研究所
IPC: G06N3/063 , G06F16/903 , G06F16/901
Abstract: 本发明提出一种面向图神经网络应用的片上存储系统及方法,包括:步骤1,根据处理单元对图神经网络模型中向量数据的访存请求,判断在片上存储系统的第一级CAM结构中是否有于该访存请求对应的查询结果,若有则执行步骤2,否则判断在片上存储系统的第二级CAM结构中是否有于该访存请求对应的查询结果,若有则执行步骤2,否则根据所需的向量数据批量对片外存储器发起片外访存请求,并替换片上存储内的指定向量数据;步骤2,根据该查询结果,得到对应的SPM索引标记,利用该SPM索引标记中的Sector Index字段以向量方式访问SPM中的相应向量数据,并将该相应数据返回给处理单元。本发明能有效提升面向图神经网络应用的片上存储系统的利用率和访存通量。
-
-
-
-
-
-
-
-
-