-
公开(公告)号:CN117473124A
公开(公告)日:2024-01-30
申请号:CN202311451594.3
申请日:2023-11-03
申请人: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC分类号: G06F16/901 , G06F16/835 , G06N3/0895
摘要: 本发明涉及图表示学习与图数据挖掘技术领域,具体涉及一种具备抵制过度平滑能力的自监督异质图表示学习方法;通过GNN分支和Transformer分支在不同视角下对节点信息进行编码,基于两个视角的信息建立对比学习任务,实现无需样本标注条件下的自监督异质图表示学习,解决了现有GNN消息传递机制的过度平滑限制网络层数的扩展,从而导致模型在面对复杂图数据的表达能力不足的问题,大大增强了模型对远距离邻域信息的捕捉能力。
-
公开(公告)号:CN117473124B
公开(公告)日:2024-04-16
申请号:CN202311451594.3
申请日:2023-11-03
申请人: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC分类号: G06F16/901 , G06F16/835 , G06N3/0895
摘要: 本发明涉及图表示学习与图数据挖掘技术领域,具体涉及一种具备抵制过度平滑能力的自监督异质图表示学习方法;通过GNN分支和Transformer分支在不同视角下对节点信息进行编码,基于两个视角的信息建立对比学习任务,实现无需样本标注条件下的自监督异质图表示学习,解决了现有GNN消息传递机制的过度平滑限制网络层数的扩展,从而导致模型在面对复杂图数据的表达能力不足的问题,大大增强了模型对远距离邻域信息的捕捉能力。
-
公开(公告)号:CN114756713A
公开(公告)日:2022-07-15
申请号:CN202210267016.3
申请日:2022-03-17
申请人: 哈尔滨工业大学(威海) , 南京龙垣信息科技有限公司
IPC分类号: G06F16/901 , G06N3/04 , G06N3/08
摘要: 本发明公开一种基于多源交互融合的图表示学习方法,包括如下步骤:提取图结构形式的网络中的节点属性、节点类别以及节点之间的邻接关系;采用基于BFS、DFS的元路径高阶邻域节点采样算法分别得到BFS和DFS高阶邻域节点集;通过一阶邻域信息聚合算法获取节点的一阶邻域信息;通过异质高阶邻域信息聚合算法获取节点的高阶领域信息;利用基于门控神经网络的多源信息融合模型将节点的自身信息、节点的高阶邻域信息以及一阶邻域信息进行融合得到节点的多源交互融合信息作为最终的向量表示;在多任务优化函数下对算法模型的参数进行优化。本发明提升了对元路径内节点信息提取能力,同时大大增强了对不同层次邻域信息的捕捉能力。
-
公开(公告)号:CN108446340A
公开(公告)日:2018-08-24
申请号:CN201810174542.9
申请日:2018-03-02
申请人: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
摘要: 本发明公开了一种面向海量小文件的用户热点数据访问预测方法,从用户访问数据的特点入手,根据文件访问的关联性特点,使用用户相关的分布式海量小文件存储系统文件访问日志,训练Skip-Gram模型,对文件的上下文访问特征进行提取,使用K-means算法对文件特征聚类,对访问相似度高的文件进行集中分析,训练GRU模型,对文件间的关联性进行分析,并根据用户当前访问文件所属类别序列进行预测,将用户未来可能访问文件类别中的全部文件预取至缓存,减少了系统的I/O次数,整体上提升了分布式海量小文件存储系统读取效率。
-
公开(公告)号:CN108446340B
公开(公告)日:2019-11-05
申请号:CN201810174542.9
申请日:2018-03-02
申请人: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
IPC分类号: G06F16/172 , G06F16/182 , G06K9/62
摘要: 本发明公开了一种面向海量小文件的用户热点数据访问预测方法,从用户访问数据的特点入手,根据文件访问的关联性特点,使用用户相关的分布式海量小文件存储系统文件访问日志,训练Skip‑Gram模型,对文件的上下文访问特征进行提取,使用K‑means算法对文件特征聚类,对访问相似度高的文件进行集中分析,训练GRU模型,对文件间的关联性进行分析,并根据用户当前访问文件所属类别序列进行预测,将用户未来可能访问文件类别中的全部文件预取至缓存,减少了系统的I/O次数,整体上提升了分布式海量小文件存储系统读取效率。
-
公开(公告)号:CN109992725A
公开(公告)日:2019-07-09
申请号:CN201910285507.9
申请日:2019-04-10
申请人: 哈尔滨工业大学(威海) , 威海翰宝网络科技有限公司
IPC分类号: G06F16/9536 , G06Q50/00
摘要: 本发明提供一种基于双向距离网络嵌入的社交网络表示方法,属于数据挖掘与网络技术领域。本发明首先读取社交关系网络中的节点并进行编码;然后读取关注与被关注关系,分别为每一个节点生成窗口大小为k的上文邻居节点序列和下文邻居节点序列,并记录每个邻居节点到该节点的有向距离;构造三层网络嵌入模型;将节点编码集作为输入进行学习,并不断进行模型超参数的调整;最后将隐藏层的权重矩阵作为最终网络嵌入的结果,每一行的向量表示作为节点的向量表示。本发明解决了现有社交关系网络的结构和拓扑信息表示不准确,对真实社交关系的还原能力较低,将不能有效的处理网络数据并精准有效的控制事件的发展的问题。本发明可用于社交网络表示。
-
-
-
-
-