-
公开(公告)号:CN118762378A
公开(公告)日:2024-10-11
申请号:CN202410494872.1
申请日:2024-04-24
Applicant: 安徽工程大学
IPC: G06V30/418 , G06V30/412 , G06V30/16 , G06V30/148 , G06V30/146 , G06V10/82 , G06N3/0464 , G06N3/08 , G06V30/18
Abstract: 本发明公开了基于深度学习端到端的图片表格识别及其信息提取方法,属于图片表格识别及其信息提取技术领域,先对待识别表格进行预处理并训练Mask R‑CNN模型,利用训练好的模型定位图片中的表格区域;同时,利用Mask R‑CNN检测表格四个顶点,微调表格区域;然后标注横纵框线制作数据集,并训练Unet网络,输入Unet图像分割对表格横纵框线进行分割,获取交点坐标;最后基于每个单元格的四个角点坐标识别该单元格内的字符,获得每个单元格的文本字符,之后根据不同格式的表格规则对单元格进行组合。本发明无需预先制定表格模板,且可以依据单元格结构特征组合文本识别结果,实现图片表格的自动识别及信息提取的结构化输出。