一种中英港语混合场景下自适应的地址库建设方法
摘要:
本发明公开是关于一种中英港语混合场景下自适应的地址库建设方法,涉及机械技术领域。地址分类转换:根据语言特性不同,对中文、港语、英语、港拼混合构成的地址进行分类;地址语义解析:对于地址翻译和地址拆分比对无法处理的基于语义构成的地址数据,通过语义特征及地区语言文化特征解析生成中文地址;地址关联比对:对多语言混合数据进行语义层面的关联比对,提取缺失、矛盾的地址数据,同时提炼地址补全素材库,支撑后续地址核准及补全;地址核准及补全:对确实和矛盾的地址进行关联关系推理,补全缺失地址,消解矛盾冲突地址信息,形成标准中文地址库。
0/0