-
公开(公告)号:CN103488671A
公开(公告)日:2014-01-01
申请号:CN201310231310.X
申请日:2013-06-09
申请人: 国际商业机器公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30946 , G06F17/30292
摘要: 本发明涉及一种用于查询和集成结构化和非结构化数据的方法和系统。所述方法包括:接收使用开域信息提取系统从第一非结构化数据集合提取的实体信息,其中所述实体信息包括所述第一非结构化数据集合的第一实体与第二实体之间的关系信息;根据所述关系信息识别模式并根据所述模式创建所述第一非结构化数据集合的架构;以及如果所创建架构的元素与第二非结构化数据集合的实体或现有结构化数据集合的架构元素之间存在足够的整体相似度,则将所创建架构的所述元素与(i)所述第二非结构化数据集合的所述实体或(ii)所述现有结构化数据集合的所述架构元素相关联。
-
公开(公告)号:CN103488671B
公开(公告)日:2017-06-16
申请号:CN201310231310.X
申请日:2013-06-09
申请人: 国际商业机器公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30946 , G06F17/30292
摘要: 本发明涉及一种用于查询和集成结构化和非结构化数据的方法和系统。所述方法包括:接收使用开域信息提取系统从第一非结构化数据集合提取的实体信息,其中所述实体信息包括所述第一非结构化数据集合的第一实体与第二实体之间的关系信息;根据所述关系信息识别模式并根据所述模式创建所述第一非结构化数据集合的架构;以及如果所创建架构的元素与第二非结构化数据集合的实体或现有结构化数据集合的架构元素之间存在足够的整体相似度,则将所创建架构的所述元素与(i)所述第二非结构化数据集合的所述实体或(ii)所述现有结构化数据集合的所述架构元素相关联。
-
公开(公告)号:CN103678451A
公开(公告)日:2014-03-26
申请号:CN201310410042.8
申请日:2013-09-10
申请人: 国际商业机器公司
IPC分类号: G06F17/30
CPC分类号: G06F17/2745 , G06F17/246 , G06F17/30339 , G06F17/30557
摘要: 本发明涉及一种用于电子表格模式提取的方法和系统。本发明的各方面提供了一种用于从电子表格提取模式的工具。在一个实施例中,检索以未编目表格格式(例如电子表格)存储的一组数据。检查所检索的一组数据的结构以便确定其数据集模式。然后,分析所述数据集模式中的数据元素以便获得有关所述数据元素的信息。根据数据集模式和元素信息,可以构造允许远程访问所述一组数据的接口。
-
-