面向多语种的通用地名语义相似度计算方法及其应用
Abstract:
一种面向多语种的通用地名语义相似度计算方法及其应用。方法包括:根据语种编码区间确定地名语种,并根据文献信息将地名进行归一化为罗马化地名;从地名信息库中获取两个地名的类别属性信息,根据地名分类体系及地名类别相似度模型计算地名类别相似度;根据地名字符串相似度模型计算罗马化后地名的字符串相似度;从地名信息库中获取两个地名的经纬度,然后根据地名空间邻近度模型计算空间邻近度;根据地名的类别相似度、字符串相似度和空间邻近度确定地名语义相似度。相比于只考虑地名字符串或空间几何特征的地名相似度计算方法,该方法能够显著提高地名相似度计算的准确性,可以更好地满足大数据环境下多语种地名的查询、匹配和共享服务等应用需求。
Patent Agency Ranking
0/0