应用于推荐场景的基于时空会话图的归纳式矩阵补全方法

    公开(公告)号:CN115840852A

    公开(公告)日:2023-03-24

    申请号:CN202211581727.4

    申请日:2022-12-09

    Applicant: 燕山大学

    Abstract: 本发明提供了一种应用于推荐场景的基于时空会话图的归纳式矩阵补全方法,该方法包括:基于用户‑项目二部图提取每个训练用户‑项目对的一跳邻居图,这些局部图包含了丰富的用户与项目交互的图模式信息。根据用户与物品之间的交互时间密度对物品进行聚类,得到用户‑项目对的会话子图序列,聚合用户的会话子图表征得到用户的局部兴趣表征。利用元学习得到会话子图之间的隐含关系,获得用户兴趣的全局表征。之后利用多头注意力机制学习用户、项目的时空邻居表征向量,将全局表征与用户、项目的时空邻居表征融合得到用户兴趣的最终表征。本发明融合了时空信息,进一步挖掘了用户的潜在兴趣,与多种最新方法相比,该方法具有竞争优势。

    基于预训练语言模型和深度提示的文本图节点分类方法

    公开(公告)号:CN119046730A

    公开(公告)日:2024-11-29

    申请号:CN202411147640.5

    申请日:2024-08-21

    Applicant: 燕山大学

    Abstract: 本发明公开了基于预训练语言模型和深度提示的文本图节点分类方法,属于计算机图表示学习领域,包括:构建框架TegPPT;采用冻结预训练语言模型参数和优化连续提示与分类头参数对框架TegPPT进行优化;具体是利用预训练语言模型作为基础模型执行文本属性图的节点分类任务,通过序列化模块联合编码文本属性与图的拓扑结构,通过连续提示激发预训练语言模型的底层知识,提升模型在理解和表达节点文本属性及节点间复杂关系的能力,深度调优技术确保预训练空间与下游任务空间充分对齐,优化了模型的泛化能力和节点分类任务上的表现。本发明不仅能更好地捕获图拓扑结构与文本信息,同时还规避了现有研究中潜在的负迁移风险。

    一种结合自监督的跨域推荐方法
    3.
    发明公开

    公开(公告)号:CN117972227A

    公开(公告)日:2024-05-03

    申请号:CN202410148115.9

    申请日:2024-02-02

    Applicant: 燕山大学

    Abstract: 本发明公开了一种结合自监督的跨域推荐方法,属于推荐系统技术领域,包括:获取用户和物品的交互数据信息;构建图神经网络,其中包括源域和目标域的图;采用图神经网络聚合邻居的embedding;重叠用户之间进行消息传递,保持源域和目标域之间共享信息的传递;根据损失函数反向传播更新embedding;使用测试集用户物品embedding进行推荐。本发明应用自监督的辅助任务拉近向量表示,能够有效的对齐相同用户,增加推荐系统的性能。

    一种基于多路邻域节点自适应选择的异质图异常检测方法

    公开(公告)号:CN118540239A

    公开(公告)日:2024-08-23

    申请号:CN202410621742.X

    申请日:2024-05-20

    Applicant: 燕山大学

    Abstract: 本发明公开了一种基于多路邻域节点自适应选择的异质图异常检测方法,属于深度学习和图数据挖掘技术领域,包括以下步骤:给定元路径模式,构建具有多维语义信息的多维图;扩展多路邻域的采样范围,动态调整邻域节点的采样概率,采样出适量的邻域节点;按照采样节点序列的依赖性、动态性和复杂性仿真强化学习任务中的基本环境要素;在多维图中部署多智能体,自适应地从多维采样节点序列中顺序选择出同配节点;利用关系感知邻域聚合学习全面的节点表征嵌入;将目标节点的表征嵌入传递到下游任务中进行异质图表示学习。本发明能够实现对异质图中邻域节点的细粒度选择,不仅增强中心节点在信息聚合过程的可靠性,还提高异质图在表示学习方面的性能。

    一种基于概率图和ViT模型的图片分类方法

    公开(公告)号:CN115953617A

    公开(公告)日:2023-04-11

    申请号:CN202211555848.1

    申请日:2022-12-06

    Applicant: 燕山大学

    Abstract: 本发明涉及一种基于概率图和ViT模型的图片分类方法,属于计算机视觉图片分类技术领域,将多头注意力机制从概率论的角度进行建模,将多头注意力中的attention value看作隐变量,利用概率图模型的Explaining‑away Effects以及Transformer的层级结构,将attention logits层层传递,并将相邻层的值进行融合,促进不同头部之间的交互。本发明针对普通Vision Transformer模型中多头注意力机制头部参数的冗余问题,将多头注意力机制建模为概率图模型,将注意力值看作隐变量,促进不同注意力头部之间的交互。

    基于对比学习和异构图注意力网络的作者名称消歧方法

    公开(公告)号:CN115481247A

    公开(公告)日:2022-12-16

    申请号:CN202211151607.0

    申请日:2022-09-21

    Applicant: 燕山大学

    Abstract: 本发明公开了基于对比学习和异构图注意力网络的作者名称消歧方法,属于知识图谱构建的实体消歧技术领域,包括使用MongoDB存取论文名称、作者、机构等信息,使用python的字符处理库对数据进行清洗,去除噪声获得更加规范的文本,清洗成适用于后续步骤的数据;使用对比学习对论文进行表征学习,获得论文的统一编码的嵌入;以纯度优先为原则对论文进行聚类,缓解论文过合并问题,得到论文簇;对上一步得到的论文簇使用异构图注意力网络进行对齐;提出过拆分检测和过拆分对齐算法,保证论文消歧质量。本发明更好的实现了同名作者消歧的消歧问题,在一定程度上解决了论文过合并和论文过拆分的问题。

    基于MD5三叉树和改进BIRCH算法的互联网论文数据自动抽取算法

    公开(公告)号:CN113486228B

    公开(公告)日:2022-05-10

    申请号:CN202110751368.1

    申请日:2021-07-02

    Applicant: 燕山大学

    Abstract: 本发明提供了一种基于MD5三叉树和改进BIRCH算法的互联网论文数据自动抽取算法,该方法包括:从所需要抽取出互联网论文数据的网站中抓取数据,进行页面清洗与预处理,基于MD5三叉树进行站内静态噪音去除,基于节点间相似度进行页间动态噪音去除,融合DBSCAN密度聚类算法对样本点数据进行密集区域与稀疏区域的划分,融合密度因素构建ACF树,修正密集区域与稀疏区域生成ACF森林,基于改进BIRCH算法进行字段单元构建,将得到的字段单元通过字段匹配与页面内容提取方法对字段单元和字段进行匹配,从而得到所需要提取的网页数据。本发明噪音去除技术更优,字段单元构建与字段匹配更高效,能有效解决互联网论文数据自动抽取问题。

    基于MD5三叉树和改进BIRCH算法的互联网论文数据自动抽取算法

    公开(公告)号:CN113486228A

    公开(公告)日:2021-10-08

    申请号:CN202110751368.1

    申请日:2021-07-02

    Applicant: 燕山大学

    Abstract: 本发明提供了一种基于MD5三叉树和改进BIRCH算法的互联网论文数据自动抽取算法,该方法包括:从所需要抽取出互联网论文数据的网站中抓取数据,进行页面清洗与预处理,基于MD5三叉树进行站内静态噪音去除,基于节点间相似度进行页间动态噪音去除,融合DBSCAN密度聚类算法对样本点数据进行密集区域与稀疏区域的划分,融合密度因素构建ACF树,修正密集区域与稀疏区域生成ACF森林,基于改进BIRCH算法进行字段单元构建,将得到的字段单元通过字段匹配与页面内容提取方法对字段单元和字段进行匹配,从而得到所需要提取的网页数据。本发明噪音去除技术更优,字段单元构建与字段匹配更高效,能有效解决互联网论文数据自动抽取问题。

    基于多模态信息不变与特定表示的Twitter机器人检测方法

    公开(公告)号:CN118968365A

    公开(公告)日:2024-11-15

    申请号:CN202411178737.2

    申请日:2024-08-27

    Applicant: 燕山大学

    Abstract: 本发明公开了基于多模态信息不变与特定表示的Twitter机器人检测方法,属于计算机图学习与多模态信息融合领域,包括构建机器人检测模型BotSAI并采用多任务方式进行优化;具体是基于Twitter用户的元数据、文本内容和异构网络拓扑结构信息,通过改进的特定于模态的编码器来提取特征;经多通道表示器将各个模态特征向量进行不变与特定表示,学习模态中的共性并突出模态间的特性,之后利用多头自注意力进行特征交互,将输出的融合特征向量串联起来,使用构造出的联合向量用于检测任务并学习模型参数。本发明利用富含有效信息的特征向量来应对社交机器人检测任务,显著提升了针对Twitter机器人检测任务的准确率。

    一种基于模态和拓扑不变表示学习的用户身份链接方法

    公开(公告)号:CN118537158A

    公开(公告)日:2024-08-23

    申请号:CN202410667493.8

    申请日:2024-05-28

    Applicant: 燕山大学

    Abstract: 本发明公开了一种基于模态和拓扑不变表示学习的用户身份链接方法,属于计算机数据挖掘领域,包括步骤1:多模态表示提取,步骤2:模态不变表示学习,步骤3:拓扑不变表示学习,步骤4:优化框架MoToInv。本发明提出了一个对抗网络来拆分模态不变和变化的表示,它捕获了跨模态的共性和特异性,从而简化了后续的细粒度多模态融合过程。此外,本发明在拓扑不变学习阶段设计了基于不变子图提取器的方法。该模块利用不变子图和变体子图的两种混合策略,以更好地捕获不变拓扑模式和消除虚假的社交关系。

Patent Agency Ranking