Invention Grant
CN101976232B 一种识别文档中数据表格的方法及装置
失效 - 权利终止
- Patent Title: 一种识别文档中数据表格的方法及装置
- Patent Title (English): Method for identifying data form in document and device thereof
-
Application No.: CN201010293736.4Application Date: 2010-09-19
-
Publication No.: CN101976232BPublication Date: 2012-06-20
- Inventor: 李譞
- Applicant: 深圳市万兴软件有限公司
- Applicant Address: 广东省深圳市南山区高新南一道TCL大厦A座901
- Assignee: 深圳市万兴软件有限公司
- Current Assignee: 万兴科技股份有限公司
- Current Assignee Address: 广东省深圳市南山区高新南一道TCL大厦A座901
- Agency: 深圳市君胜知识产权代理事务所
- Agent 刘文求; 韩金明
- Main IPC: G06F17/22
- IPC: G06F17/22
Abstract:
本发明属于文档应用领域,公开了一种识别文档中数据表格的方法和装置,所述方法包括:提取PDF文档中的文本;根据提取的文本的属性对文本进行划分,得到一划分结果;对划分结果进行判断和处理,识别并生成数据表格;将数据表格保存至独立的中间数据结构中;根据目标文档格式将所述中间数据结构中的数据表格还原。本发明准确的对PDF中的表格数据进行转换,极大的提高了转换后的可编辑性,减少了转换后对文档再次手工处理的工作。
Public/Granted literature
- CN101976232A 一种识别文档中数据表格的方法及装置 Public/Granted day:2011-02-16
Information query