-
公开(公告)号:CN117291152A
公开(公告)日:2023-12-26
申请号:CN202210692042.0
申请日:2022-06-17
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06F40/154 , G06F40/174 , G06F40/18
摘要: 本发明公开了一种表格的提取方法和装置。该方法包括:识别图像中的待提取的原始表格,提取原始表格的单元格结构,其中,原始表格中的内容不可编辑;提取原始表格中的文本属性;将单元格结构和文本属性转换为超文本标记语言描述;解析超文本标记语言描述,得到目标表格,其中,目标表格中的内容可编辑。本发明解决了无法将图像中的表格数据转换为可编辑的表格数据的技术问题。