发明公开
- 专利标题: 基于地理位置信息的机构命名排歧方法及装置
- 专利标题(英): Organization name disambiguation method and device based on geographic position information
-
申请号: CN201910987453.0申请日: 2019-10-17
-
公开(公告)号: CN110851669A公开(公告)日: 2020-02-28
- 发明人: 唐杰 , 邵洲 , 袁莎 , 刘德兵
- 申请人: 清华大学
- 申请人地址: 北京市海淀区清华园
- 专利权人: 清华大学
- 当前专利权人: 清华大学
- 当前专利权人地址: 北京市海淀区清华园
- 代理机构: 北京清亦华知识产权代理事务所
- 代理商 王艳斌
- 主分类号: G06F16/903
- IPC分类号: G06F16/903 ; G06F16/29
摘要:
本发明公开了一种基于地理位置信息的机构命名排歧方法及装置,其中,该方法包括:对输入文本信息抽取生成机构信息集合,对输入文本信息挖掘生成具有地理位置指向性的信息,并结构化为地理位置指向性信息集合;根据机构信息集合、地理位置指向性信息集合和多地图API,将机构信息集合中的每个机构映射为不同的地理位置,将映射结果进行结构化生成结构化机构信息集合;根据相似度算法对结构化机构信息集合进行相似度计算,根据计算结果生成机构相似度矩阵;根据机构相似度矩阵判断机构信息集合中的不同机构是否属于同一机构,根据判断结果进行机构命名排歧,输出排歧结果。该方法能够辅助实现快速准确地实现学术成果中不同机构之间的命名排歧。