面向地址编码的中文地址语义解析方法

    公开(公告)号:CN101393544A

    公开(公告)日:2009-03-25

    申请号:CN200810156588.4

    申请日:2008-10-07

    IPC分类号: G06F17/22 G06F17/27 G06F17/30

    摘要: 本发明公开了一种面向地址编码的中文地址语义解析方法,其步骤如下:第一步:根据样本数据,构建地址特征字库;a.建立样本数据;b.筛选特征字;c.筛选附属特征字;所筛选的特征字和附属特征字构成了特征字库;第二步:根据特征字库,按照地址表示规则,将中文地址转换为数字形式的字符串;第三步:构建地址解析规则库;第四步:语义解析,包括:地址表示,将原始地址转换为数字表示、地址解析,将数字表示的地址拆分为地址要素;地址还原,将数字表示的解析结果还原为与原始地址对应的字符串。