文档中表格数据的信息提取方法及系统
摘要:
本申请提出一种文档中表格数据的信息提取方法及系统,该方法包括:将文档中的待处理表格划分为多个单一的单元格;通过预设的单元格记录形式记录每个单一的单元格的信息,信息包括单元格内容和单元格合并区域的信息;根据单元格内容和单元格所处合并区域的信息,确定待处理表格的标题行;根据文档的类型确定目标信息,以目标信息为基准,从标题行开始按行提取待处理表格中每行的信息。该方法可以便捷和准确的将表格中的信息提取出来,提高表格数据提取的准确性。
0/0