一种基于深度神经网络模型的地址信息特征抽取方法

    公开(公告)号:CN110377686A

    公开(公告)日:2019-10-25

    申请号:CN201910666632.4

    申请日:2019-07-23

    申请人: 浙江大学

    摘要: 本发明公开了一种基于深度神经网络模型的地址信息特征抽取方法。本发明利用深度神经网络架构,将文本特征提取、地址规范化建设和语义空间融合等任务转化为可量化的深度神经网络模型构建与训练优化问题。以地址中的字符为基本输入单元,设计语言模型将其向量化表达,再将地名地址规范化建设的关键技术通过神经网络目标任务加以实现。同时考虑到地名地址空间表达特性,提出地址语义-空间的特征融合方案,设计加权聚类方法与特征融合模型,从自然语言的地址文本中抽取出融合有语义特征和空间特征的融合向量。本发明可实现地址信息的特征内容提取,其结构具备高拓展性,能够统一地址信息任务的解决思路,对于城市建设具有重要意义。

    一种基于深度神经网络模型的地址信息特征抽取方法

    公开(公告)号:CN110377686B

    公开(公告)日:2021-09-17

    申请号:CN201910666632.4

    申请日:2019-07-23

    申请人: 浙江大学

    摘要: 本发明公开了一种基于深度神经网络模型的地址信息特征抽取方法。本发明利用深度神经网络架构,将文本特征提取、地址规范化建设和语义空间融合等任务转化为可量化的深度神经网络模型构建与训练优化问题。以地址中的字符为基本输入单元,设计语言模型将其向量化表达,再将地名地址规范化建设的关键技术通过神经网络目标任务加以实现。同时考虑到地名地址空间表达特性,提出地址语义‑空间的特征融合方案,设计加权聚类方法与特征融合模型,从自然语言的地址文本中抽取出融合有语义特征和空间特征的融合向量。本发明可实现地址信息的特征内容提取,其结构具备高拓展性,能够统一地址信息任务的解决思路,对于城市建设具有重要意义。