用于标识匹配的方法、系统和机器可读硬件存储装置

    公开(公告)号:CN107273977A

    公开(公告)日:2017-10-20

    申请号:CN201710254250.1

    申请日:2009-10-23

    发明人: 阿伦·安德森

    IPC分类号: G06N99/00

    摘要: 用于标识匹配的方法、系统和机器可读硬件存储装置。用于标识第一数据元素和一个或多个第二数据元素中的每一个之间的一个或多个匹配的方法,第一数据元素具有多个字段并且字段中的一个或多个的一个或多个值表示第一数据元素的关键字,方法包括:确定关键字的一个或多个变体和一个或多个第二数据元素的一个或多个搜索字段的一个或多个值之间的一个或多个变体匹配,关键字的变体是根据关键字的变体关系而指定的;选择一个或多个第二数据元素的一个或多个比较字段的一个或多个值,比较字段与搜索字段不同;以及基于一个或多个第二数据元素的一个或多个比较字段的值与第一数据元素中的一个或多个比较字段的值的比较来对一个或多个变体匹配进行确证。

    用于内存列存储数据库的多核算法

    公开(公告)号:CN103177057B

    公开(公告)日:2017-09-19

    申请号:CN201210433322.6

    申请日:2012-09-28

    申请人: SAP欧洲公司

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30466 G06F17/30463

    摘要: 本申请涉及用于内存列存储数据库的多核算法。模式可以在查询的至少一部分中识别,该查询的定义是在查询请求中接收的。可将所识别的模式与预定义模式的集合相匹配,每个预定义模式与保存在库中的多个预编译的查询执行子组件的至少一个预编译的查询执行子组件相关联。可生成执行查询的计划,例如通过基于从定义推导的计划的伪代码表示、将与所匹配的模式相关联的预编译的查询执行子组件合并到计划中。

    数据操作执行、数据质量度量和数据元素联接方法和系统

    公开(公告)号:CN103810527B

    公开(公告)日:2017-08-08

    申请号:CN201310671951.7

    申请日:2009-10-23

    发明人: 阿伦.安德森

    IPC分类号: G06N7/02

    摘要: 本发明提供了一种用于执行从数据存储系统接收关键字并返回一个或多个数据元素的数据操作的方法和系统、一种用于对数据存储系统中的数据元素的数据质量进行度量的方法和系统、以及一种用于对来自存储在至少一个数据存储系统中的两个或多个数据集合的数据元素进行联接的方法和系统。所述用于执行从数据存储系统接收关键字并返回一个或多个数据元素的数据操作的方法包括:基于关键字和数据元素的一个或多个搜索字段的值之间的候选匹配,确定多个候选数据元素;以及基于与搜索字段不同的候选数据元素的一个或多个比较字段的值对候选匹配进行确证。

    数据查询的方法和装置
    34.
    发明授权

    公开(公告)号:CN103714073B

    公开(公告)日:2017-04-12

    申请号:CN201210375556.X

    申请日:2012-09-29

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种在无共享数据库中查询数据的方法和装置。所述方法包括:获取查询请求,针对该查询请求生成优化的访问计划,其中所述查询请求涉及存储在外部数据源中的外部数据,并包含对外部数据的期望分布的定义;基于所述优化的访问计划获取与期望分布相关的数据分布信息;将数据分布信息传送给外部数据源,使得外部数据源按照数据分布信息将外部数据进行分割和返回;以及按照所述优化的访问计划对分割的外部数据进行查询相关处理。所述装置与方法对应。根据本发明的方法和装置,允许定义外部数据的期望分布,并使得外部数据源按照该期望分布来分割和返回外部数据,由此避免数据查询中跨节点的数据访问,提高数据查询的效率。

    查询优化方法及查询编译器

    公开(公告)号:CN103729392B

    公开(公告)日:2017-03-01

    申请号:CN201310349740.1

    申请日:2013-08-12

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30466

    摘要: 本发明涉及一种查询优化方法及查询编译器。查询优化方法包括如下步骤:检索SQL查询内的子查询;从检索到的所述子查询中识别标量子查询;分析所识别的所述标量子查询来识别关联标量子查询;根据所识别的所述关联标量子查询的结果形式,将具有所识别的所述关联标量子查询的查询反嵌套为新连接方式。

    数据处理方法、数据处理装置及计算机可读存储介质

    公开(公告)号:CN102982065B

    公开(公告)日:2016-09-21

    申请号:CN201210367944.3

    申请日:2004-09-15

    IPC分类号: G06F17/30

    摘要: 本发明提供一种数据处理方法、计算机系统及计算机可读存储介质,所述方法包括接收记录流,每个记录包括一个或多个字段和对应值;在多个处理器之间分割所述记录流;为每个记录生成在各记录中具有值的每个字段的字段值对,所述字段值对表示各记录中的字段和用于所述字段的对应值;为每个处理器生成每个相异字段值对的调查元素,所述调查元素包括表示所述相异字段和所述相异值的字段值对的计数;基于用于各字段的所述调查元素计算所述记录流中每个字段的统计数字;以及基于对应的统计数字为所述记录流中的每个字段生成概要。本发明可以自动确定或协同用户确定的信息可以用于转存数据源的元数据,之后用于进一步的处理。

    数据操作执行、数据质量度量和数据元素联接方法和系统

    公开(公告)号:CN103810527A

    公开(公告)日:2014-05-21

    申请号:CN201310671951.7

    申请日:2009-10-23

    发明人: 阿伦.安德森

    IPC分类号: G06N7/02

    摘要: 本发明提供了一种用于执行从数据存储系统接收关键字并返回一个或多个数据元素的数据操作的方法和系统、一种用于对数据存储系统中的数据元素的数据质量进行度量的方法和系统、以及一种用于对来自存储在至少一个数据存储系统中的两个或多个数据集合的数据元素进行联接的方法和系统。所述用于执行从数据存储系统接收关键字并返回一个或多个数据元素的数据操作的方法包括:基于关键字和数据元素的一个或多个搜索字段的值之间的候选匹配,确定多个候选数据元素;以及基于与搜索字段不同的候选数据元素的一个或多个比较字段的值对候选匹配进行确证。

    查询优化方法及查询编译器

    公开(公告)号:CN103729392A

    公开(公告)日:2014-04-16

    申请号:CN201310349740.1

    申请日:2013-08-12

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30466

    摘要: 本发明涉及一种查询优化方法及查询编译器。查询优化方法包括如下步骤:检索SQL查询内的子查询;从检索到的所述子查询中识别标量子查询;分析所识别的所述标量子查询来识别关联标量子查询;根据所识别的所述关联标量子查询的结果形式,将具有所识别的所述关联标量子查询的查询反嵌套为新连接方式。