格式文档关键信息块配准及提取的方法及装置
Abstract:
本发明涉及一种格式文档关键信息块配准及提取的方法及装置,所述方法:对格式文档的灰度图像进行模式定义;根据标签部件的位置、标签域构建弹性框架;根据标签部件的图像像素占空比,确定弹性框架的配准目标的候选集合;根据标签部件的图像特征对弹性框架进行粗配准,确定价值部件的初始矩形框;根据标签部件的位置对价值部件的初始矩形框进行精确配准,确定价值部件的精准矩形框;根据所述标签部件的位置、字符属性信息及价值部件的精准矩形框确定格式文档关键信息块。本发明格式文档关键信息块配准及提取的方法通过构建弹性框架、多次配准,从而能够准确提取价值部件的精准矩形框内容提取准确,便于数据库的统一管理。
Public/Granted literature
Patent Agency Ranking
0/0