发明公开
- 专利标题: 一种基于语义与结构采样策略的实体对齐方法和装置
-
申请号: CN202311596284.0申请日: 2023-11-27
-
公开(公告)号: CN117556016A公开(公告)日: 2024-02-13
- 发明人: 何可嘉 , 徐会芳 , 邓桃 , 张英强 , 梁攀飞 , 马超
- 申请人: 中国电力科学研究院有限公司
- 申请人地址: 北京市海淀区清河小营东路15号
- 专利权人: 中国电力科学研究院有限公司
- 当前专利权人: 中国电力科学研究院有限公司
- 当前专利权人地址: 北京市海淀区清河小营东路15号
- 代理机构: 北京中巡通大知识产权代理有限公司
- 代理商 李宏德
- 主分类号: G06F16/332
- IPC分类号: G06F16/332 ; G06F16/33 ; G06F16/36 ; G06F40/30 ; G06N5/022
摘要:
本申请涉及一种基于语义与结构采样策略的实体对齐方法,包括将选择的未标注实体的上一次迭代得到的边界不确定性数值和未标记实体链接的其他实体的上一次迭代的边界不确定性数值迭代计算,得到未标记实体的边界不确定性的数值,根据未标记实体的边界不确定性的数值,选择标注实体标注并更新标记数据集,利用更新后标记数据集实体对齐模型训练,重复上述步骤,直到实体对齐模型满足预设训练结果。本申请优先标注对知识图谱融合更有价值的数据,更新语义表征模型和实体对齐模型,提升采样策略的效果,不断迭代上述过程,在有限的预算下,可以实现更好的实体对齐效果。本申请还涉及一种基于语义与结构采样策略的实体对齐装置、设备和存储介质。