一种基于知识图谱增强图对比学习的推荐方法

    公开(公告)号:CN118014685A

    公开(公告)日:2024-05-10

    申请号:CN202410161790.5

    申请日:2024-02-05

    Applicant: 东北大学

    Abstract: 本发明提供一种基于知识图谱增强图对比学习的推荐方法,涉及数据推荐技术领域。该方法首先获取所有需要推荐的用户以及需要推荐的物品,并获取物品的属性信息;然后构建四个图结构;再构建多图融合模型,对推荐物品和用户进行特征向量学习,得到混有知识图谱信息和协作图信息的用户特征向量和推荐物品特征向量;构建纯协作图模型,对用户特征向量以及推荐物品特征向量进行学习,得到只包含交互信息的用户向量表示和推荐物品向量表示;确定统一的优化目标,进行迭代学习,得到用户和物品的两组特征向量;基于得到的用户和物品的特征向量,以及需要被推荐的用户列表,遍历用户列表,依次为每一个用户进行推荐。

    一种从Web点击流数据中挖掘代表序列模式的方法

    公开(公告)号:CN112765469B

    公开(公告)日:2023-10-27

    申请号:CN202110096836.6

    申请日:2021-01-25

    Applicant: 东北大学

    Abstract: 本发明提供一种从Web点击流数据中挖掘代表序列模式的方法,涉及序列模式挖掘技术领域。该方法首先输入Web点击流序列数据集、最小支持度和最大覆盖度,并遍历一次数据集保留不小于最小支持度的所有频繁站点作为序列生成种子;对每一个序列生成种子采用缝隙扩展枚举树,结合缝隙扫描剪枝策略和闭合检查得到该种子的所有频繁闭合超序列;进一步采用局部代表序列筛选技术选出该种子的所有代表序列;遍历所有序列生成种子,输出每个种子的代表序列,得到Web点击流数据的所有代表序列模式。优点是:代表序列模式能有效解决频繁序列模式数量庞大而可用性低的矛盾,能增强结果的可用性;为Web点击流的在线用户行为分析、信息推荐、引擎优化等应用提供参考。

    一种针对大图的基于对比学习的半监督社区搜索方法

    公开(公告)号:CN116501986A

    公开(公告)日:2023-07-28

    申请号:CN202310546779.6

    申请日:2023-05-16

    Applicant: 东北大学

    Abstract: 本发明提供一种针对大图的基于对比学习的半监督社区搜索方法,首先调用图划分算法对原始图进行预处理,将原始图处理成一些彼此间相关性较小的图分区,然后从原始图中选择出训练节点,确定每个训练节点所对应的图分区并进行初始化,其次联合图神经网络、超图神经网络和多层感知机模型对初始的低阶编码和高阶编码进行变换,得到图分区中每个节点最终的低阶编码和高阶编码后,使用对比学习技术进行模型参数训练,最后使用训练好的模型输出查询结点对应图分区的低阶编码矩阵,并采用图搜索算法确定查询节点的社区结果;本发明方法不仅可以自动提取数据集的潜在特征,减少人工标注的成本,而且能有效内存消耗低,处理大规模图时效率较高。

    基于自监督双粒度多图学习的文本分类方法

    公开(公告)号:CN116401361A

    公开(公告)日:2023-07-07

    申请号:CN202310038679.2

    申请日:2023-01-13

    Applicant: 东北大学

    Abstract: 本发明提供一种基于自监督双粒度多图学习的文本分类方法,涉及文本分类技术领域。该方法首先获得原始文本数据集与对应的标签集,并对原始文本数据集进行数据预处理,得到多图数据集;再利用增强编码器对图数据进行增强,并使用图编码器学习增强后的图表示;然后将多头自注意力机制作用于图表示,学习图包中各个图之间的上下文信息,生成包级图,并利用包编码器通过包级图学习包表示;再通过图‑图的学习机制同时学习图表示和包表示,并设计包级对比损失和图级对比损失作为损失函数,自监督地学习包表示和图表示;最后对待分类的文本分类任务利用学习到的包表示和图表示,在粗粒度和细粒度上对待分类的文本同时进行标签预测,实现文本分类。

    基于多特征学习的以太坊钓鱼诈骗账户检测装置及方法

    公开(公告)号:CN114782051A

    公开(公告)日:2022-07-22

    申请号:CN202210484477.6

    申请日:2022-05-06

    Applicant: 东北大学

    Abstract: 本发明提供了基于多特征学习的以太坊钓鱼诈骗账户检测装置及方法,涉及以太坊交易网络的安全领域。该装置包括数据采集模块、以太坊钓鱼诈骗网络构建模块、以太坊钓鱼诈骗网络初始化模块、特征提取模块、账户类别平衡模块和分类模块。该方法包括采集以太坊钓鱼诈骗相关数据;构建以太坊钓鱼诈骗网络G并确定该网络的邻接矩阵A;初始化该网络的节点特征和边特征,获得初始节点特征矩阵F和初始边特征矩阵X;根据A、F和X提取每个节点的相关特征,并为各特征分配注意力系数;对该网络中的账户类别进行平衡处理后,使用图神经网络更新节点的节点特征,并基于交叉熵损失函数训练分类器,区分出钓鱼诈骗账户和正常账户。该装置及方法准确度和安全性均较高且节约资源。

    一种基于查询点的流数据簇搜索方法

    公开(公告)号:CN114510506A

    公开(公告)日:2022-05-17

    申请号:CN202210149443.1

    申请日:2022-02-18

    Applicant: 东北大学

    Abstract: 本发明提供了一种基于查询点的流数据簇搜索方法,涉及流数据聚类技术领域。该方法包括利用QALSH算法确定到达流数据点的近邻的步骤和利用近邻以扩张的方式搜索出某查询点所属簇的全部数据点的步骤。该方法针对于流数据,能够基于查询点快速且准确地搜索该查询点所属的簇,即该查询点所属簇的所有数据点。实现的过程中,那些与该查询点不属于同一个簇的数据点不会参与到簇搜索过程中,所以既能实现应用需求,又能节省计算资源。另外,在进行簇搜索的过程中,利用数据点之间的近邻关系可以确定出簇中哪些数据点距离查询点更近,哪些数据点距离查询点稍远,这样对于那些距离更近的数据点可以做优先推荐,提高推荐的合理性和实用性。

    一种面向图数据的投影聚类方法

    公开(公告)号:CN108073946A

    公开(公告)日:2018-05-25

    申请号:CN201711222718.5

    申请日:2017-11-29

    Applicant: 东北大学

    Abstract: 本发明公开了一种面向图数据的投影聚类方法,该方法包括:针对待处理的图数据集D,采用深度优先搜索算法,获取图数据集D中所有子图的代表性子图模式;针对所述代表性子图模式,获取所述图数据集D的Top-k多样性子图模式,将所有的Top-k多样性子图模式生成Top-k多样性子图模式集合RS;将所述图数据集D中的每一个子图与所述Top-k子图模式集合RS中的特征子图进行投影匹配,获取所述图数据集D的特征矩阵;利用自适应熵作为聚类目标函数,采用图投影聚类算法对所述特征矩阵进行聚类处理,获得聚类结果。上述方法使得图数据集中的聚类结果更准,多样性更好,且高维数据的处理效果更快。

    一种基于自身维度的高维k近邻微簇搜索方法

    公开(公告)号:CN120045742A

    公开(公告)日:2025-05-27

    申请号:CN202510108948.7

    申请日:2025-01-23

    Applicant: 东北大学

    Abstract: 本发明提供一种基于自身维度的高维k近邻微簇搜索方法,涉及相似性检索技术领域。该方法首先对向量数据库中的对象进行投影,计算每个对象的自身维度,对向量数据库中所有对象进行分块,并为每个数据块构建索引;将查询向量投影到向量数据库同一空间中,计算查询向量的基准维度;设定k近邻微簇查询结果的簇心与查询向量之间距离上限,从查询向量的基准维度为查询起点设置左右指针在指针对应的数据块内进行范围查询;检验k近邻微簇查询结果是否满足k近邻微簇查询距离要求和密度要求,更新距离上限,继续进行查询,直到左右指针都已达到查询结果所在数据块的左右边界,返回k近邻微簇结果集。

    一种基于代理模型的无监督进化图神经网络搜索方法

    公开(公告)号:CN120012823A

    公开(公告)日:2025-05-16

    申请号:CN202510084492.5

    申请日:2025-01-20

    Applicant: 东北大学

    Abstract: 本发明提供一种基于代理模型的无监督进化图神经网络搜索方法,涉及神经架构搜索技术领域,本发明在应用场景上考虑无监督场景,在网络层面上同时考虑网络层的拓扑关系、特征融合策略、不固定网络层数量,使用图对比学习方法训练图神经网络获取分类精度,使用遗传算法作为搜索算法,使用代理模型、权值共享策略减少了在搜索过程中图神经架构的评估时间。本发明适应无标签信息场景,同时考虑网络层的拓扑关系、特征融合策略,并且无需提前训练超网络,不固定网络层数,搜索空间更广,使用遗传算法全局搜索,引入预测器模块、权值共享策略减少搜索过程中图神经架构的评估时间。

    基于多特征学习的以太坊钓鱼诈骗账户检测装置及方法

    公开(公告)号:CN114782051B

    公开(公告)日:2025-03-14

    申请号:CN202210484477.6

    申请日:2022-05-06

    Applicant: 东北大学

    Abstract: 本发明提供了基于多特征学习的以太坊钓鱼诈骗账户检测装置及方法,涉及以太坊交易网络的安全领域。该装置包括数据采集模块、以太坊钓鱼诈骗网络构建模块、以太坊钓鱼诈骗网络初始化模块、特征提取模块、账户类别平衡模块和分类模块。该方法包括采集以太坊钓鱼诈骗相关数据;构建以太坊钓鱼诈骗网络G并确定该网络的邻接矩阵A;初始化该网络的节点特征和边特征,获得初始节点特征矩阵F和初始边特征矩阵X;根据A、F和X提取每个节点的相关特征,并为各特征分配注意力系数;对该网络中的账户类别进行平衡处理后,使用图神经网络更新节点的节点特征,并基于交叉熵损失函数训练分类器,区分出钓鱼诈骗账户和正常账户。该装置及方法准确度和安全性均较高且节约资源。

Patent Agency Ranking