基于中文实体关系抽取的地下空间知识图谱构建方法

    公开(公告)号:CN119831011A

    公开(公告)日:2025-04-15

    申请号:CN202411712092.6

    申请日:2024-11-27

    Abstract: 本发明公开了一种基于中文实体关系抽取的地下空间知识图谱构建方法,能够高效处理和分析大量非结构化的地下空间领域文本信息,抽取关系三元组,清晰揭示实体间的关联,以构建地下空间知识图谱。通过Bert预训练模型为文本中的每个标记生成初始表示,捕获关键上下文特征。接着,以级联方式提取头实体、尾实体和关系,构建Bi‑CasRTE条件级联网络,精准确定关系三元组,同时由于跨场景获取的数据类别不均衡,通过重建去偏策略,引入了一种改进型预测去偏策略以减小偏差。本发明不仅解决了地下空间领域中文文本信息获取难题,还提高了信息处理效率与准确性,为地下空间领域的深入探索和应用提供了强大支撑,为未来地下空间信息的开发与利用奠定了坚实基础。

    一种融合字词和关系信息的中文实体关系联合抽取方法

    公开(公告)号:CN118504525A

    公开(公告)日:2024-08-16

    申请号:CN202410568922.6

    申请日:2024-05-09

    Abstract: 本发明公开了一种融合字词和关系信息的中文实体关系联合抽取方法,利用中文分词器获取字词两种细粒度的中文文本,提出了字词位置上下文融合编码器,实现将字、词细粒度文本、位置信息、上下文信息融合编码,获取包含字、词、位置、上下文信息的编码词向量,提出了基于先验关系交叉融合机制的编码器,将先验关系信息融入实体关系联合抽取中,本发明考虑到中文的语法特点,充分结合字信息、词信息、位置信息、关系信息,构建实体识别和关系抽取的内在联系,克服了现有关系抽取中所存在的不足,有效提高的中文文本实体关系联合抽取准确率。

Patent Agency Ranking