用于捕获低成本查询计划的基于学习的查询计划缓存

    公开(公告)号:CN114041128A

    公开(公告)日:2022-02-11

    申请号:CN201980096780.5

    申请日:2019-05-24

    Abstract: 提供了一种查询处理设备,包括耦合到通信接口的处理器和查询存储器。所述处理器接收处于训练模式下的查询的当前提交、存储的先前执行计划和存储的所述先前执行计划的统计信息。所述处理器为所述查询生成当前执行计划,执行所述当前执行计划并收集统计信息。所述处理器将所述当前执行计划和所述统计信息存储在所述查询存储器中,并根据所述当前执行计划确定所述查询不处于所述训练模式。所述处理器从多个存储的用于所述查询的执行计划中选择一个用于所述查询的执行计划,包括所述先前执行计划和所述当前执行计划,并将所述选择的用于所述查询的执行计划与指示所述查询不处于所述训练模式的指示一起存储在所述查询存储器中。

    使用具有规范形式的逻辑查询步骤进行查询处理

    公开(公告)号:CN113874832A

    公开(公告)日:2021-12-31

    申请号:CN202080023252.X

    申请日:2020-03-19

    Abstract: 一种查询处理设备,包括:通信接口,用于访问数据库和数据库目录;存储器,用于存储指令;以及处理器,耦合至所述存储器和所述通信接口。所述处理器执行所述指令以:解析查询以为所述查询生成第一和第二执行计划;从所述数据库目录中检索所述第一和第二执行计划的先前执行的逻辑步骤的相应先前确定的基数值;从所述第一执行计划或所述第二执行计划中选择执行计划,基于所述先前确定的基数值,所述选定的执行计划具有较低的成本;以及对从所述数据库访问的数据执行所述选定的执行计划。所述查询处理系统将在执行所述逻辑步骤期间确定的实际基数值存储在所述数据库目录中以供后续查询使用。因此,所述查询处理设备可以重复使用先前确定的基数值。

    利用机器学习估计MPPDB中的查询资源消耗

    公开(公告)号:CN110537175A

    公开(公告)日:2019-12-03

    申请号:CN201880026160.X

    申请日:2018-04-25

    Abstract: 提供了一种用于在大规模并行处理数据库(massively parallel processing database,简称MPPDB)中利用机器学习估计查询资源消耗的方法和装置。在各种实施例中,所述机器学习可以联合执行所述查询资源消耗估计和资源极端事件检测;利用自适应内核,所述自适应内核用于针对每个系统设置的数据学习最佳相似关系度量;以及利用多层堆叠技术,所述多层堆叠技术用于利用各种基本分类器模型的输出。所公开的实施例的优势和优点包括提供更快和更可靠的系统性能以及避免发生存储空间用完(out of memory,简称OOM)事件等资源问题。

    使用具有规范形式的逻辑查询步骤进行查询处理

    公开(公告)号:CN119415549A

    公开(公告)日:2025-02-11

    申请号:CN202411280621.X

    申请日:2020-03-19

    Abstract: 一种查询处理设备,包括:通信接口,用于访问数据库和数据库目录;存储器,用于存储指令;以及处理器,耦合至所述存储器和所述通信接口。所述处理器执行所述指令以:解析查询以为所述查询生成第一和第二执行计划;从所述数据库目录中检索所述第一和第二执行计划的先前执行的逻辑步骤的相应先前确定的基数值;从所述第一执行计划或所述第二执行计划中选择执行计划,基于所述先前确定的基数值,所述选定的执行计划具有较低的成本;以及对从所述数据库访问的数据执行所述选定的执行计划。所述查询处理系统将在执行所述逻辑步骤期间确定的实际基数值存储在所述数据库目录中以供后续查询使用。因此,所述查询处理设备可以重复使用先前确定的基数值。

    使用具有规范形式的逻辑查询步骤进行查询处理

    公开(公告)号:CN113874832B

    公开(公告)日:2024-10-11

    申请号:CN202080023252.X

    申请日:2020-03-19

    Abstract: 一种查询处理设备,包括:通信接口,用于访问数据库和数据库目录;存储器,用于存储指令;以及处理器,耦合至所述存储器和所述通信接口。所述处理器执行所述指令以:解析查询以为所述查询生成第一和第二执行计划;从所述数据库目录中检索所述第一和第二执行计划的先前执行的逻辑步骤的相应先前确定的基数值;从所述第一执行计划或所述第二执行计划中选择执行计划,基于所述先前确定的基数值,所述选定的执行计划具有较低的成本;以及对从所述数据库访问的数据执行所述选定的执行计划。所述查询处理系统将在执行所述逻辑步骤期间确定的实际基数值存储在所述数据库目录中以供后续查询使用。因此,所述查询处理设备可以重复使用先前确定的基数值。

    利用机器学习估计MPPDB中的查询资源消耗的方法及装置

    公开(公告)号:CN110537175B

    公开(公告)日:2022-07-22

    申请号:CN201880026160.X

    申请日:2018-04-25

    Abstract: 提供了一种用于在大规模并行处理数据库(massively parallel processing database,简称MPPDB)中利用机器学习估计查询资源消耗的方法和装置。在各种实施例中,所述机器学习可以联合执行所述查询资源消耗估计和资源极端事件检测;利用自适应内核,所述自适应内核用于针对每个系统设置的数据学习最佳相似关系度量;以及利用多层堆叠技术,所述多层堆叠技术用于利用各种基本分类器模型的输出。所公开的实施例的优势和优点包括提供更快和更可靠的系统性能以及避免发生存储空间用完(out of memory,简称OOM)事件等资源问题。

Patent Agency Ranking