一种分布式列存储系统索引的方法

    公开(公告)号:CN106250523B

    公开(公告)日:2019-04-16

    申请号:CN201610634581.3

    申请日:2016-08-04

    IPC分类号: G06F16/31

    摘要: 本发明公开了一种分布式列存储系统索引的方法,包括:获取每列数据的分布特征,设定每列数据的域值及划分规则;根据域值及划分规则,得到划分后的连续数据区域;分别对应每个数据区域建立一个区域编码向量;进行统计计算,得到每列数据的统计信息,将统计信息与对应的区域编码向量合并,得到带有统计信息的区域编码向量;将带有统计信息的区域编码向量作为位图索引的位向量进行数据的索引。所述分布式列存储系统索引的方法通过设定每列数据的域值和划分规则,使得分组位图索引的划分方式与查询的过滤条件相符合,通过计算列数据的统计信息,不仅提高了分组位图查询的准确性,而且能够保留列存储系统中数据的统计信息,保证数据信息的完整性。