发明公开
- 专利标题: 一种多语义特征协同的中文地址匹配方法
-
申请号: CN202411400842.6申请日: 2024-10-09
-
公开(公告)号: CN118897899A公开(公告)日: 2024-11-05
- 发明人: 李朋朋 , 张玉婷 , 刘涛 , 李精忠 , 杜萍 , 刘双童 , 王文宁
- 申请人: 兰州交通大学
- 申请人地址: 甘肃省兰州市安宁区安宁西路88号
- 专利权人: 兰州交通大学
- 当前专利权人: 兰州交通大学
- 当前专利权人地址: 甘肃省兰州市安宁区安宁西路88号
- 代理机构: 西安汇恩知识产权代理事务所
- 代理商 李洁
- 主分类号: G06F16/387
- IPC分类号: G06F16/387 ; G06F40/205 ; G06F40/284 ; G06F40/30 ; G06N3/042 ; G06N3/0442 ; G06N3/0455 ; G06N3/0464 ; G06N3/08 ; G06N5/04 ; G06F16/35
摘要:
本发明公开了一种多语义特征协同的中文地址匹配方法,该方法将地址匹配问题转换为二分类问题。首先,对中文地址进行地址要素解析,并利用训练语料库训练Word2vec模型生成其对应的词嵌入向量表示;然后,分别使用文本循环卷积神经网络和图注意力网络提取地址要素的多语义特征;最后,基于增强序列推理模型对地址多语义特征进行局部推理和推理组合,来实现中文地址的精准匹配。该方法显著优于现有的基于深度学习的中文地址匹配方法,在匹配精准率、召回率和F1值均取得了优异的结果,这对于地理编码等应用具有重要意义。