-
公开(公告)号:CN119831011A
公开(公告)日:2025-04-15
申请号:CN202411712092.6
申请日:2024-11-27
Applicant: 中国矿业大学
IPC: G06N5/022 , G06F16/36 , G06F16/353 , G06F16/334 , G06F40/295 , G06F18/2415 , G06N3/045 , G06F16/901
Abstract: 本发明公开了一种基于中文实体关系抽取的地下空间知识图谱构建方法,能够高效处理和分析大量非结构化的地下空间领域文本信息,抽取关系三元组,清晰揭示实体间的关联,以构建地下空间知识图谱。通过Bert预训练模型为文本中的每个标记生成初始表示,捕获关键上下文特征。接着,以级联方式提取头实体、尾实体和关系,构建Bi‑CasRTE条件级联网络,精准确定关系三元组,同时由于跨场景获取的数据类别不均衡,通过重建去偏策略,引入了一种改进型预测去偏策略以减小偏差。本发明不仅解决了地下空间领域中文文本信息获取难题,还提高了信息处理效率与准确性,为地下空间领域的深入探索和应用提供了强大支撑,为未来地下空间信息的开发与利用奠定了坚实基础。
-
公开(公告)号:CN118504525A
公开(公告)日:2024-08-16
申请号:CN202410568922.6
申请日:2024-05-09
Applicant: 中国矿业大学
IPC: G06F40/16 , G06N3/0455 , G06N3/042
Abstract: 本发明公开了一种融合字词和关系信息的中文实体关系联合抽取方法,利用中文分词器获取字词两种细粒度的中文文本,提出了字词位置上下文融合编码器,实现将字、词细粒度文本、位置信息、上下文信息融合编码,获取包含字、词、位置、上下文信息的编码词向量,提出了基于先验关系交叉融合机制的编码器,将先验关系信息融入实体关系联合抽取中,本发明考虑到中文的语法特点,充分结合字信息、词信息、位置信息、关系信息,构建实体识别和关系抽取的内在联系,克服了现有关系抽取中所存在的不足,有效提高的中文文本实体关系联合抽取准确率。
-
公开(公告)号:CN118504566A
公开(公告)日:2024-08-16
申请号:CN202410568923.0
申请日:2024-05-09
Applicant: 中国矿业大学
IPC: G06F40/295 , G06F40/16 , G06N3/0442 , G06N3/045 , G06N3/0455 , G06N3/042 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于字符对网格表示的嵌套命名实体识别方法,包括以下步骤:首先,收集数据,构建中文命名实体识别语料库;其次,通过预训练模型和双向门控循环单元获得句子的向量化文本,使用多头双仿射注意力机制和多尺度融合方法相结合,增强对实体相邻关系建模信息的学习能力;同时考虑边界特征,有效利用实体边界信息。本发明在包含扁平实体和嵌套实体的中文海战领域命名实体识别语料库和中文细粒度数据集上进行了实验,结果显示本发明有效解决了扁平实体和嵌套实体统一识别的问题,相较于其他模型取得了有竞争力的结果。
-
-