用于查询大小估计的显著性采样

    公开(公告)号:CN105493085A

    公开(公告)日:2016-04-13

    申请号:CN201480046615.6

    申请日:2014-06-26

    IPC分类号: G06F17/30

    摘要: 用于查询大小估计的显著性采样包括识别出一数据库表中的两个或更多列,其在一个或多个其他表中具有相应的列。对所识别出的列中的每一列的域应用一个或多个散列函数。对第一列的域应用第一散列函数,并且对第二列的域应用第二散列函数。选择数据库表中的行的子集。所述选择包括选择数据库表中的其中第一散列函数的结果满足第一数值阈值的各行,以及选择数据库表中的其中第二散列函数的结果满足第二数值阈值的各行。创建对应于数据库表的样本数据库表。所述样本数据库表包括数据库表中的行的所选子集。

    创建数据库表的样本的方法、系统和计算机可读存储介质

    公开(公告)号:CN105493085B

    公开(公告)日:2019-06-18

    申请号:CN201480046615.6

    申请日:2014-06-26

    IPC分类号: G06F16/2453 G06F16/22

    摘要: 用于查询大小估计的显著性采样包括识别出一数据库表中的两个或更多列,其在一个或多个其他表中具有相应的列。对所识别出的列中的每一列的域应用一个或多个散列函数。对第一列的域应用第一散列函数,并且对第二列的域应用第二散列函数。选择数据库表中的行的子集。所述选择包括选择数据库表中的其中第一散列函数的结果满足第一数值阈值的各行,以及选择数据库表中的其中第二散列函数的结果满足第二数值阈值的各行。创建对应于数据库表的样本数据库表。所述样本数据库表包括数据库表中的行的所选子集。