-
公开(公告)号:CN116702760A
公开(公告)日:2023-09-05
申请号:CN202310646008.4
申请日:2023-06-01
申请人: 中国石油大学(华东) , 山东省国土测绘院 , 浙江大学
IPC分类号: G06F40/232 , G06F40/295 , G06F40/30 , G06F40/242 , G06F40/247 , G06N3/045 , G06N3/0499 , G06N3/08
摘要: 本发明涉及地理命名实体纠错技术领域,提供了一种基于预训练深度学习的地理命名实体纠错方法,以BERT预训练语言模型为代表的基于自注意力机制的地理命名实体文本纠错方法为参考,设计了基于地理命名实体语义模型的以地理命名实体文本纠错为目标任务的方法,主要解决的是来自泛在网络文本的地理命名实体文本数据可能存在的错字问题。本发明基于地理命名实体语义模型的以地理命名实体文本纠错为目标任务的方法,在预训练模型的基础上进行了微调,具有较强的泛化能力;基于预训练深度学习的地理命名实体语义模型微调的方法能极大地提高模型在地理命名实体文本纠错任务中的表现,相较于传统方法,此方法在各项评价指标上有较好的表现。
-
公开(公告)号:CN110377686A
公开(公告)日:2019-10-25
申请号:CN201910666632.4
申请日:2019-07-23
申请人: 浙江大学
摘要: 本发明公开了一种基于深度神经网络模型的地址信息特征抽取方法。本发明利用深度神经网络架构,将文本特征提取、地址规范化建设和语义空间融合等任务转化为可量化的深度神经网络模型构建与训练优化问题。以地址中的字符为基本输入单元,设计语言模型将其向量化表达,再将地名地址规范化建设的关键技术通过神经网络目标任务加以实现。同时考虑到地名地址空间表达特性,提出地址语义-空间的特征融合方案,设计加权聚类方法与特征融合模型,从自然语言的地址文本中抽取出融合有语义特征和空间特征的融合向量。本发明可实现地址信息的特征内容提取,其结构具备高拓展性,能够统一地址信息任务的解决思路,对于城市建设具有重要意义。
-
公开(公告)号:CN110377686B
公开(公告)日:2021-09-17
申请号:CN201910666632.4
申请日:2019-07-23
申请人: 浙江大学
IPC分类号: G06F16/29 , G06F16/35 , G06F40/30 , G06F40/126 , G06K9/62
摘要: 本发明公开了一种基于深度神经网络模型的地址信息特征抽取方法。本发明利用深度神经网络架构,将文本特征提取、地址规范化建设和语义空间融合等任务转化为可量化的深度神经网络模型构建与训练优化问题。以地址中的字符为基本输入单元,设计语言模型将其向量化表达,再将地名地址规范化建设的关键技术通过神经网络目标任务加以实现。同时考虑到地名地址空间表达特性,提出地址语义‑空间的特征融合方案,设计加权聚类方法与特征融合模型,从自然语言的地址文本中抽取出融合有语义特征和空间特征的融合向量。本发明可实现地址信息的特征内容提取,其结构具备高拓展性,能够统一地址信息任务的解决思路,对于城市建设具有重要意义。
-
-