一种面向信息驱动的分布式图表示学习方法及系统

    公开(公告)号:CN116484979A

    公开(公告)日:2023-07-25

    申请号:CN202310252364.8

    申请日:2023-03-15

    Abstract: 本发明公开了一种面向信息驱动的分布式图表示学习方法及系统,包括:从图数据中执行多阶邻近性感知的流式图划分策略,使用动态负载约束来确保各计算节点间的负载均衡;进而通过以增量信息为中心的计算机制,确保对随机游走生成路径的信息有效性进行动态衡量且以常量级在各计算节点间进行消息通信;通过分布式Skip‑Gram学习模型来生成顶点的嵌入向量,具体地,利用全局词向量矩阵和本地缓存器实现顶点向量的访问和更新操作,以改善访问局部性和减少训练更新期间产生的缓存抖动;然后通过多窗口共享负样本计算机制以充分利用CPU的硬件资源;利用基于热点词块的同步机制以保证在分布式环境下高效地进行参数同步。本发明高效且有效地表征图数据信息。

    一种社交网络数据分析方法、系统及电子设备

    公开(公告)号:CN116302527A

    公开(公告)日:2023-06-23

    申请号:CN202310239697.7

    申请日:2023-03-13

    Abstract: 本发明公开了一种社交网络数据分析方法、系统及电子设备。包括:从图中拥有最大度的顶点开始,根据最大度广度优先原则,从其邻居中访问下一个顶点,并且使用同一原则不断访问下去,直到遍历所有的顶点,将顶点流按照访问顺序排序。将顶点视作一维水平排列,并根据并行的粒度,将顶点流均分成多个批次,每个线程平均分配这些批次。每个线程按顶点顺序按批次处理上述的顶点流,对每个顶点都根据多阶属性感知的策略给每个划分区域计算分数然后将顶点划分到分数最高的区域。本发明能够高效的进行图划分,支持大规模的图数据,并且保证划分结果的有效性。

Patent Agency Ranking