基于大模型技术的多粒度异构节点表征学习方法

    公开(公告)号:CN118296478A

    公开(公告)日:2024-07-05

    申请号:CN202410462144.2

    申请日:2024-04-17

    申请人: 南通大学

    摘要: 本发明公开基于大模型技术的多粒度异构节点表征学习方法,包括:将节点信息转换文本序列;对文本序列进行预处理;通过余弦相似度决定原始节点属于哪个社区,划分最细粒度下的社区;通过余弦相似度和Jaccard相似度评价两两社区之间的内容相似性和结构相似性,设置阈值,将相似度高的社区进行合并,进而得到最粗一级的社区;将不同粒度下的目标节点特征和one‑hot后的节点位置信息一同放入大模型模块中处理,得到该节点的演化信息;通过最小化交叉熵损失函数优化模型;将最终生成的节点特征放入下游任务中进行评判。本发明考虑不同粒度下的异构节点信息,结合大模型技术进行预处理并将不同粒度下的信息加入位置信息编码,提高了节点表征学习的准确性与完整性。

    基于大模型技术的多视图融合异构节点表征学习方法

    公开(公告)号:CN118296554A

    公开(公告)日:2024-07-05

    申请号:CN202410462142.3

    申请日:2024-04-17

    申请人: 南通大学

    摘要: 本发明公开一种基于大模型技术的多视图融合异构节点表征学习方法,包括:将节点信息转换成one‑hot向量作为初始特征值;将异构图下不同类型的节点信息映射到相同嵌入维度中;采用不同方式挖掘不同视图下的节点信息特征,从而分比得到图中节点的属性信息、节点间结构信息以及节点自身的语义信息等;通过基于大模型技术的多视图融合方法将不同视图下学习到的节点特征信息进行聚合,将改进的DiT作为融合机制,从而更深入的融合异构图下多个视图下的节点特征信息;进行节点分类以及节点聚类从而评判生成节点特征的效果。本发明将大模型技术和多视图融合进行结合来进行异构图上的节点表征学习,从而更好的进行多视图融合并使得学习到的节点信息更加准确。