表格的信息提取方法、系统、设备、介质及程序产品
摘要:
本公开是关于一种表格的信息提取方法、系统、设备、介质及程序产品,包括:获得待进行信息提取的表格;将表格输入预先训练好的图神经网络中,得到图神经网络从表格中提取的目标单元格中的内容,其中,图神经网络是基于如下方式预先训练好的:获得表格样本,并根据所述表格样本的表头单元格和内容单元格进行标注分类,以及将关注内容对应的表头单元格和内容单元格进行标注分类;根据标注好的所述表格样本的表结构构造图结构,基于所述图结构以及训练任务训练所述图神经网络。本申请通过预训练的图神经网络来提取待进行信息提取的表格,可以在规则及不规则表格条件下,准确提取指定内容信息。
0/0