-
公开(公告)号:CN107273977A
公开(公告)日:2017-10-20
申请号:CN201710254250.1
申请日:2009-10-23
申请人: 起元技术有限责任公司
发明人: 阿伦·安德森
IPC分类号: G06N99/00
CPC分类号: G06F17/30466 , G06F17/30386 , G06F17/30542 , G06F17/30598 , G06F17/30979 , G06N99/005
摘要: 用于标识匹配的方法、系统和机器可读硬件存储装置。用于标识第一数据元素和一个或多个第二数据元素中的每一个之间的一个或多个匹配的方法,第一数据元素具有多个字段并且字段中的一个或多个的一个或多个值表示第一数据元素的关键字,方法包括:确定关键字的一个或多个变体和一个或多个第二数据元素的一个或多个搜索字段的一个或多个值之间的一个或多个变体匹配,关键字的变体是根据关键字的变体关系而指定的;选择一个或多个第二数据元素的一个或多个比较字段的一个或多个值,比较字段与搜索字段不同;以及基于一个或多个第二数据元素的一个或多个比较字段的值与第一数据元素中的一个或多个比较字段的值的比较来对一个或多个变体匹配进行确证。
-
公开(公告)号:CN103177057B
公开(公告)日:2017-09-19
申请号:CN201210433322.6
申请日:2012-09-28
申请人: SAP欧洲公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30466 , G06F17/30463
摘要: 本申请涉及用于内存列存储数据库的多核算法。模式可以在查询的至少一部分中识别,该查询的定义是在查询请求中接收的。可将所识别的模式与预定义模式的集合相匹配,每个预定义模式与保存在库中的多个预编译的查询执行子组件的至少一个预编译的查询执行子组件相关联。可生成执行查询的计划,例如通过基于从定义推导的计划的伪代码表示、将与所匹配的模式相关联的预编译的查询执行子组件合并到计划中。
-
公开(公告)号:CN103810527B
公开(公告)日:2017-08-08
申请号:CN201310671951.7
申请日:2009-10-23
申请人: 起元技术有限责任公司
发明人: 阿伦.安德森
IPC分类号: G06N7/02
CPC分类号: G06F17/30466 , G06F17/30386 , G06F17/30542 , G06F17/30598 , G06F17/30979 , G06N99/005
摘要: 本发明提供了一种用于执行从数据存储系统接收关键字并返回一个或多个数据元素的数据操作的方法和系统、一种用于对数据存储系统中的数据元素的数据质量进行度量的方法和系统、以及一种用于对来自存储在至少一个数据存储系统中的两个或多个数据集合的数据元素进行联接的方法和系统。所述用于执行从数据存储系统接收关键字并返回一个或多个数据元素的数据操作的方法包括:基于关键字和数据元素的一个或多个搜索字段的值之间的候选匹配,确定多个候选数据元素;以及基于与搜索字段不同的候选数据元素的一个或多个比较字段的值对候选匹配进行确证。
-
公开(公告)号:CN103714073B
公开(公告)日:2017-04-12
申请号:CN201210375556.X
申请日:2012-09-29
申请人: 国际商业机器公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30466 , G06F17/30433 , G06F17/30448 , G06F17/30463
摘要: 本发明公开了一种在无共享数据库中查询数据的方法和装置。所述方法包括:获取查询请求,针对该查询请求生成优化的访问计划,其中所述查询请求涉及存储在外部数据源中的外部数据,并包含对外部数据的期望分布的定义;基于所述优化的访问计划获取与期望分布相关的数据分布信息;将数据分布信息传送给外部数据源,使得外部数据源按照数据分布信息将外部数据进行分割和返回;以及按照所述优化的访问计划对分割的外部数据进行查询相关处理。所述装置与方法对应。根据本发明的方法和装置,允许定义外部数据的期望分布,并使得外部数据源按照该期望分布来分割和返回外部数据,由此避免数据查询中跨节点的数据访问,提高数据查询的效率。
-
-
公开(公告)号:CN102982065B
公开(公告)日:2016-09-21
申请号:CN201210367944.3
申请日:2004-09-15
申请人: 起元科技有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30371 , G06F17/30466 , G06F17/30486 , G06F17/30489 , G06F17/30539 , G06F17/3056 , G06F17/30569 , G06F17/30598
摘要: 本发明提供一种数据处理方法、计算机系统及计算机可读存储介质,所述方法包括接收记录流,每个记录包括一个或多个字段和对应值;在多个处理器之间分割所述记录流;为每个记录生成在各记录中具有值的每个字段的字段值对,所述字段值对表示各记录中的字段和用于所述字段的对应值;为每个处理器生成每个相异字段值对的调查元素,所述调查元素包括表示所述相异字段和所述相异值的字段值对的计数;基于用于各字段的所述调查元素计算所述记录流中每个字段的统计数字;以及基于对应的统计数字为所述记录流中的每个字段生成概要。本发明可以自动确定或协同用户确定的信息可以用于转存数据源的元数据,之后用于进一步的处理。
-
公开(公告)号:CN104834754A
公开(公告)日:2015-08-12
申请号:CN201510288922.1
申请日:2015-05-29
申请人: 武汉大学
IPC分类号: G06F17/30
CPC分类号: G06F17/30327 , G06F17/30466
摘要: 本发明提供了一种基于连接代价的SPARQL语义数据查询优化方法,本方法使用RDF的模式信息来精简SPARQL基本图模式,然后使用B树结构快速估计SPARQL连接图的节点大小及边权值,使用连接代价估计并结合动态规划方法找到最优逻辑查询计划,从而提高RDF语义数据的查询效率。
-
公开(公告)号:CN104346433A
公开(公告)日:2015-02-11
申请号:CN201410380355.8
申请日:2014-08-05
申请人: 国际商业机器公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30469 , G06F17/30463 , G06F17/30466 , G06F17/30477 , G06F17/30445 , G06F17/30153
摘要: 本发明涉及一种用于数据库查询操作的可缩放加速的方法和系统。各实施例包括用于将多个处理操作卸载到加速器的方法、系统和计算机程序产品。各方面包括接收来自应用的数据库查询,针对所述查询执行分析,以及标识多个可用加速器。各方面还包括针对所述多个可用加速器中的每一个上可用的一个或多个模板检索成本信息,基于所述成本信息和针对所述查询的分析确定查询执行计划,以及基于所述查询执行计划,将一个或多个查询操作卸载到所述多个加速器中的至少一个。
-
公开(公告)号:CN103810527A
公开(公告)日:2014-05-21
申请号:CN201310671951.7
申请日:2009-10-23
申请人: 起元技术有限责任公司
发明人: 阿伦.安德森
IPC分类号: G06N7/02
CPC分类号: G06F17/30466 , G06F17/30386 , G06F17/30542 , G06F17/30598 , G06F17/30979 , G06N99/005
摘要: 本发明提供了一种用于执行从数据存储系统接收关键字并返回一个或多个数据元素的数据操作的方法和系统、一种用于对数据存储系统中的数据元素的数据质量进行度量的方法和系统、以及一种用于对来自存储在至少一个数据存储系统中的两个或多个数据集合的数据元素进行联接的方法和系统。所述用于执行从数据存储系统接收关键字并返回一个或多个数据元素的数据操作的方法包括:基于关键字和数据元素的一个或多个搜索字段的值之间的候选匹配,确定多个候选数据元素;以及基于与搜索字段不同的候选数据元素的一个或多个比较字段的值对候选匹配进行确证。
-
-
-
-
-
-
-
-
-