发明公开
- 专利标题: 图纸中的目录提取方法、装置、电子设备和存储介质
-
申请号: CN202311031166.5申请日: 2023-08-15
-
公开(公告)号: CN117172212A公开(公告)日: 2023-12-05
- 发明人: 王宇涵 , 袁松岭 , 刘绍福
- 申请人: 深圳市万翼数字技术有限公司
- 申请人地址: 广东省深圳市南山区粤海街道高新区社区粤兴六道06号中科纳能大厦A601
- 专利权人: 深圳市万翼数字技术有限公司
- 当前专利权人: 深圳市万翼数字技术有限公司
- 当前专利权人地址: 广东省深圳市南山区粤海街道高新区社区粤兴六道06号中科纳能大厦A601
- 代理机构: 深圳智汇远见知识产权代理有限公司
- 代理商 刘洁
- 主分类号: G06F40/137
- IPC分类号: G06F40/137 ; G06F16/35 ; G06N3/0455
摘要:
本申请涉及一种图纸中的目录提取方法、装置、电子设备和存储介质,应用于计算机技术领域,其中,方法包括:确定待识别图纸中的属于图纸目录的目标表格;判断所述目标表格中是否存在线段信息;若不存在,提取所述目标表格中的第一文本信息;对所述第一文本信息进行分类,得到至少一个分类结果;基于所述分类结果,对所述第一文本信息进行纵向分组和横向分组,得到分组结果;基于所述分组结果确定所述目标表格的表格结构;基于所述表格结构和所述第一文本信息对所述目标表格进行提取,得到所述目标表格。以解决现有技术中,识别工作量大,而且过度依赖线段和单元格信息,无法兼容非标准表格和不规范情况的问题。