发明公开
CN117291152A 表格的提取方法和装置
审中-公开
- 专利标题: 表格的提取方法和装置
-
申请号: CN202210692042.0申请日: 2022-06-17
-
公开(公告)号: CN117291152A公开(公告)日: 2023-12-26
- 发明人: 张治强 , 熊龙飞 , 段纪伟 , 黄旭进 , 侯冰基 , 邓灿赏 , 张炜杰
- 申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
- 申请人地址: 广东省珠海市高新区唐家湾镇前岛环路321号金山软件园5号楼; ;
- 专利权人: 珠海金山办公软件有限公司,北京金山办公软件股份有限公司,武汉金山办公软件有限公司
- 当前专利权人: 珠海金山办公软件有限公司,北京金山办公软件股份有限公司,武汉金山办公软件有限公司
- 当前专利权人地址: 广东省珠海市高新区唐家湾镇前岛环路321号金山软件园5号楼; ;
- 代理机构: 北京华夏泰和知识产权代理有限公司
- 代理商 卢万腾
- 主分类号: G06F40/154
- IPC分类号: G06F40/154 ; G06F40/174 ; G06F40/18
摘要:
本发明公开了一种表格的提取方法和装置。该方法包括:识别图像中的待提取的原始表格,提取原始表格的单元格结构,其中,原始表格中的内容不可编辑;提取原始表格中的文本属性;将单元格结构和文本属性转换为超文本标记语言描述;解析超文本标记语言描述,得到目标表格,其中,目标表格中的内容可编辑。本发明解决了无法将图像中的表格数据转换为可编辑的表格数据的技术问题。