发明公开
- 专利标题: 一种融合多源信息的人名消歧方法及装置
-
申请号: CN202311059658.5申请日: 2023-08-22
-
公开(公告)号: CN117149949A公开(公告)日: 2023-12-01
- 发明人: 赵淳璐 , 潘进 , 柳毅 , 潘斌 , 王元杰 , 李紫微 , 姚晓 , 杨博
- 申请人: 国家计算机网络与信息安全管理中心
- 申请人地址: 北京市朝阳区裕民路甲3号
- 专利权人: 国家计算机网络与信息安全管理中心
- 当前专利权人: 国家计算机网络与信息安全管理中心
- 当前专利权人地址: 北京市朝阳区裕民路甲3号
- 代理机构: 北京君尚知识产权代理有限公司
- 代理商 余长江
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/335 ; G06F16/35 ; G06F18/23
摘要:
本发明公开了一种融合多源信息的人名消歧方法及装置,所述方法包括:将所有文本划分为若干个类;基于同名作者对应的机构名称、文本共同作者和文本主题内容,分别对每一类文本进行聚类,以得到该类文本的机构名第一聚类结果、共同作者第一聚类结果和主题内容第一聚类结果;基于簇内机构信息及文本的共现信息,对机构名第一聚类结果、共同作者第一聚类结果和主题内容第一聚类结果进行融合,得到该类文本的初步聚类结果;提取初步聚类结果中的单簇文本,并基于所述单簇文本与该类文本中其他文本的相似度进行单簇文本的融合后,得到人名消歧结果。本发明可以实现了更好的消歧准确率。