- 专利标题: 一种进口货物报关单OCR识别分行处理方法及装置
-
申请号: CN202111012168.0申请日: 2021-08-31
-
公开(公告)号: CN113723301B公开(公告)日: 2024-08-30
- 发明人: 洪志权 , 卢山 , 崔伟成 , 李双
- 申请人: 广州新丝路信息科技有限公司
- 申请人地址: 广东省广州市南沙区龙穴大道中13号1501房之自编1510B
- 专利权人: 广州新丝路信息科技有限公司
- 当前专利权人: 广州新丝路信息科技有限公司
- 当前专利权人地址: 广东省广州市南沙区龙穴大道中13号1501房之自编1510B
- 代理机构: 广东翰锐律师事务所
- 代理商 胡厚财
- 主分类号: G06V30/414
- IPC分类号: G06V30/414 ; G06V30/418 ; G06V30/148 ; G06V30/19
摘要:
本申请公开了一种进口货物报关单OCR识别分行处理方法及装置,通过基于商品编码的表头对应的第一坐标,遍历预设坐标范围内的第n行的起始字符,通过判断第n行中预设数量的字符是否为预设属性,例如统一为数字,从而确定该行是否为新的一行,从而利用两行起始字符之间的第二纵坐标之差确定该行的行距,同时实现了分列以及分行,解决了在对进口货物报关单进行OCR识别处理后,通常由于进口货物报关单中商品编号与商品名称及规格型号两列在表格中的内容紧挨在一起,导致的OCR识别为一列内容,且由于没有准确识别出商品编号列,存在着无法区分商品名称与规格型号列中每行内容的边界的技术问题。
公开/授权文献
- CN113723301A 一种进口货物报关单OCR识别分行处理方法及装置 公开/授权日:2021-11-30