- 专利标题: 表格的信息提取方法、系统、设备、介质及程序产品
-
申请号: CN202210387989.0申请日: 2022-04-14
-
公开(公告)号: CN114495140B公开(公告)日: 2022-07-12
- 发明人: 宋恒 , 刘道学 , 仇明清 , 李亚楠 , 耿天宝 , 程维国 , 孙朝福 , 张志强
- 申请人: 安徽数智建造研究院有限公司
- 申请人地址: 安徽省合肥市高新区习友路3333号
- 专利权人: 安徽数智建造研究院有限公司
- 当前专利权人: 安徽数智建造研究院有限公司
- 当前专利权人地址: 安徽省合肥市高新区习友路3333号
- 代理机构: 北京清亦华知识产权代理事务所
- 代理商 赵静
- 主分类号: G06V30/413
- IPC分类号: G06V30/413 ; G06V30/414 ; G06V10/82 ; G06N3/04 ; G06N3/08
摘要:
本公开是关于一种表格的信息提取方法、系统、设备、介质及程序产品,包括:获得待进行信息提取的表格;将表格输入预先训练好的图神经网络中,得到图神经网络从表格中提取的目标单元格中的内容,其中,图神经网络是基于如下方式预先训练好的:获得表格样本,并根据所述表格样本的表头单元格和内容单元格进行标注分类,以及将关注内容对应的表头单元格和内容单元格进行标注分类;根据标注好的所述表格样本的表结构构造图结构,基于所述图结构以及训练任务训练所述图神经网络。本申请通过预训练的图神经网络来提取待进行信息提取的表格,可以在规则及不规则表格条件下,准确提取指定内容信息。
公开/授权文献
- CN114495140A 表格的信息提取方法、系统、设备、介质及程序产品 公开/授权日:2022-05-13