-
公开(公告)号:CN117453832A
公开(公告)日:2024-01-26
申请号:CN202311229403.9
申请日:2023-09-22
Applicant: 郑州轻工业大学
Abstract: 本发明属于知识图谱实体对齐技术领域,特别涉及一种基于过滤加速的领域知识图谱实体对齐装置及方法,该装置包括过滤模块、嵌入模块和对齐模块,过滤模块借助过滤机制排除领域知识图谱中包含的干扰实体和明显不对齐实体并生成实体的双向候选集;嵌入模块首先通过自适应学习,构建实体间双维度结构特征作为结构聚合器的输入,结构聚合器学习实体的结构级别嵌入;再通过引入属性聚合器计算属性值权重建模属性级别嵌入;对齐模块计算嵌入向量之间的相似性,采用欧几里得范数来进行实体对齐。本发明采用了过滤机制过滤干扰实体和明显不匹配实体,减少不必要的计算,并通过多类型图神经网络在领域知识图谱的结构级别和属性级别上学习更复杂的嵌入表示。
-
公开(公告)号:CN119692328A
公开(公告)日:2025-03-25
申请号:CN202411500907.4
申请日:2024-10-25
Applicant: 郑州轻工业大学
IPC: G06F40/205 , G06F40/284 , G06F40/30 , G06F18/22 , G06F18/25 , G06N3/0455 , G06N3/044 , G06N3/08
Abstract: 本发明涉及文本数据处理技术领域,特别涉及一种面向动态文本的增量实体解析方法、可读存储介质及装置,基于神经网络语言模型的粗调过滤模块过滤掉明显不匹配的实体描述文本对,生成候选实体文本对集合;基于深度语义的特征融合模块生成融合上下文信息的实体文本对高阶语义向量;基于深度度量学习的精调解析模块增强对文本中语义关系的捕获能力,获得实体文本对的解析结果。增量实体解析部分对动态文本数据进行增量实体解析,并通过不断利用每个时间步的高可信匹配与不匹配实体文本对来迭代优化精调解析模型的参数。本发明对动态文本数据进行增量实体解析,且每个时间步的精调解析模型能够利用从上一个时间步的解析结果中分析出高可信标注数据集。
-