Invention Grant
- Patent Title: 格式文档关键信息块配准及提取的方法及装置
-
Application No.: CN201710100063.8Application Date: 2017-02-23
-
Publication No.: CN106844767BPublication Date: 2019-12-13
- Inventor: 史存召 , 何坤 , 肖柏华 , 贾馥溪 , 王春恒
- Applicant: 中国科学院自动化研究所
- Applicant Address: 北京市海淀区中关村东路95号
- Assignee: 中国科学院自动化研究所
- Current Assignee: 中国科学院自动化研究所
- Current Assignee Address: 北京市海淀区中关村东路95号
- Agency: 北京瀚仁知识产权代理事务所
- Agent 郭文浩; 吴晓芬
- Main IPC: G06F16/11
- IPC: G06F16/11
Abstract:
本发明涉及一种格式文档关键信息块配准及提取的方法及装置,所述方法:对格式文档的灰度图像进行模式定义;根据标签部件的位置、标签域构建弹性框架;根据标签部件的图像像素占空比,确定弹性框架的配准目标的候选集合;根据标签部件的图像特征对弹性框架进行粗配准,确定价值部件的初始矩形框;根据标签部件的位置对价值部件的初始矩形框进行精确配准,确定价值部件的精准矩形框;根据所述标签部件的位置、字符属性信息及价值部件的精准矩形框确定格式文档关键信息块。本发明格式文档关键信息块配准及提取的方法通过构建弹性框架、多次配准,从而能够准确提取价值部件的精准矩形框内容提取准确,便于数据库的统一管理。
Public/Granted literature
- CN106844767A 格式文档关键信息块配准及提取的方法及装置 Public/Granted day:2017-06-13
Information query