一种内存云计算平台上的数据仓库安全OLAP方法

    公开(公告)号:CN105701200B

    公开(公告)日:2019-08-20

    申请号:CN201610016726.3

    申请日:2016-01-12

    发明人: 张延松 张宇 王珊

    摘要: 本发明涉及一种内存云计算平台上的数据仓库安全OLAP方法,在OLAP计算模型上消除事实表语义信息,事实表只存储数值型数据而不存储数据描述信息;在OLAP计算模型上采用基于编码的计算方法,在企业内部私有数据平台上进行维表查询和编码,在事实表存储云平台上实现基于无语义编码上的多维计算,编码的OLAP查询结果返回企业内部私有数据平台后进行语义解析,返回真实的查询结果;云平台事实表存储通过增加安全维度对度量属性进行编码,改变原始度量属性存储方式,防止对事实表度量属性的非法访问。本发明能够支持企业数据仓库数据在云平台上的存储和计算,提高OLAP计算的性价比并保证企业数据安全,能够应用于企业内存OLAP云计算或其他OLAP计算应用中。

    网页信息处理方法及装置

    公开(公告)号:CN104794237B

    公开(公告)日:2018-04-27

    申请号:CN201510229707.4

    申请日:2015-05-07

    IPC分类号: G06F17/30

    摘要: 本发明提供一种网页信息处理方法及装置,所述方法包括:获取待检索网页的时间间隔信息;根据所述待检索网页的时间间隔信息将所述待检索网页的集合划分为多个区域,通过线段树结构将所述时间间隔信息构成的时间间隔集合划分成至少两个单元时间间隔;基于所述单元时间间隔为每个区域添加倒排线段树索引;根据查询时间间隔以及每个区域的倒排线段树索引分别对每个区域内的待检索网页进行检索,确定与所述查询时间间隔关联的第一候选网页;从所述第一候选网页中确定包含查询关键字的第二候选网页;输出所述第二候选网页。

    面向数据库一体机的内存数据仓库行列存储转换实现方法

    公开(公告)号:CN106874437A

    公开(公告)日:2017-06-20

    申请号:CN201710064124.X

    申请日:2017-02-04

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种面向数据库一体机的内存数据仓库行列存储转换实现方法,其步骤:构建内存数据仓库一体机存储模型:在数据库一体机架构上,采用维表集中存储,事实表分布存储策略;设置存储引擎;设置行列存储模型转换策略;在数据库一体机上的实时OLAP查询处理任务分解为在主节点事实表行缓存、影子数据列缓存以及存储服务器节点事实表主分片上的分布式OLAP查询处理任务,实现基于实时数据上的OLAP分析处理。本发明实现了将事务处理引擎的行存储记录高效地转换为分析引擎的列存储记录,并支持在实时数据上的OLAP分析处理。本发明适用于面向内存数据仓库一体机在更新操作中的行列存储结构转换应用场景。

    一种内存数据库OLTP&OLAP并发查询优化方法

    公开(公告)号:CN103942342B

    公开(公告)日:2017-02-01

    申请号:CN201410198279.9

    申请日:2014-05-12

    发明人: 张延松 张宇 王珊

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种内存数据库OLTP&OLAP并发查询优化方法,其步骤为:1)采用双查询处理引擎,对维表和事实表采用独立的存储引擎;2)维表采用嵌入式存储引擎独立的并发控制机制进行更新;事实表在逻辑上相当于若干个连续的数组,系统维护两个动态数据结构:读记录指针和写记录指针,读记录指针记录当前OLAP查询的最后一条记录位置,写记录指针记录新记录的插入位置;3)OLTP事务队列与OLAP事务队列以写指针和读指针为分界各自独立执行;事实表采用基于固定行数的列存储水平分片模型,N行列存储记录作为一个独立的列存储容器,每个列存储容器采用独立的数据压缩机制;4)OLAP查询在访问列存储容器时由列存储容器访问接口提供对压缩或非压缩数据上的访问功能。

    一种基于函数依赖关系的OLAP分组聚集方法

    公开(公告)号:CN105930388A

    公开(公告)日:2016-09-07

    申请号:CN201610232371.1

    申请日:2016-04-14

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30333 G06F17/30592

    摘要: 本发明涉及一种基于函数依赖关系的OLAP分组聚集方法,其步骤:定义分组属性间的函数依赖树结构,确定分组属性及表间属性之间的函数依赖关系;对GROUP BY子句的分组属性按分组属性函数依赖树进行检测;将查询分组属性划分为两个分组,分别由函数依赖键属性和其他分组属性组成;对维表按函数依赖关系进行模式分解,维表使用代理键机制,采用内存列存储机制;在维表模式分解和代理键索引机制下,分组聚集计算进一步将分组属性转换为对函数依赖键属性的分组聚集计算,在完成分组聚集计算后,按函数依赖键属性值直接映射到相关维表记录的内存偏移地址,完成抽取其他相关分组属性的操作,输出完整的SQL查询结果。本发明能约简分组属性大小,提高哈希分组计算效率的作用。

    一种内存云计算平台上的数据仓库安全OLAP方法

    公开(公告)号:CN105701200A

    公开(公告)日:2016-06-22

    申请号:CN201610016726.3

    申请日:2016-01-12

    发明人: 张延松 张宇 王珊

    IPC分类号: G06F17/30 G06F21/62

    摘要: 本发明涉及一种内存云计算平台上的数据仓库安全OLAP方法,在OLAP计算模型上消除事实表语义信息,事实表只存储数值型数据而不存储数据描述信息;在OLAP计算模型上采用基于编码的计算方法,在企业内部私有数据平台上进行维表查询和编码,在事实表存储云平台上实现基于无语义编码上的多维计算,编码的OLAP查询结果返回企业内部私有数据平台后进行语义解析,返回真实的查询结果;云平台事实表存储通过增加安全维度对度量属性进行编码,改变原始度量属性存储方式,防止对事实表度量属性的非法访问。本发明能够支持企业数据仓库数据在云平台上的存储和计算,提高OLAP计算的性价比并保证企业数据安全,能够应用于企业内存OLAP云计算或其他OLAP计算应用中。

    检索方法
    7.
    发明公开

    公开(公告)号:CN104794238A

    公开(公告)日:2015-07-22

    申请号:CN201510229773.1

    申请日:2015-05-07

    IPC分类号: G06F17/30

    摘要: 本发明实施例提供一种检索方法。该检索方法包括:获取页面的时间间隔信息与关键字信息;根据时间间隔信息与关键字信息构建TriI索引;根据TriI索引计算待查询的关键字的相关度分数;根据预设规则获得与相关度分数对应的页面,将相关度分数对应的页面作为检索结果。本发明实施例通过根据构建基于时间间隔信息和关键字信息的TriI索引,并根据该TriI索引获得待查询的关键字的相关度分数,根据TIKQ算法获得相关度分数最高的前k位各自对应的页面,并将获得的页面作为检索结果。实现了检索时的高效且同时的对时间间隔信息和关键字信息进行处理,提高了TIKQ中文本内容具有较大区分度的场景的查询效率。

    面向列存储数据仓库的多维OLAP查询处理方法

    公开(公告)号:CN102663116B

    公开(公告)日:2014-04-23

    申请号:CN201210114111.6

    申请日:2012-04-17

    发明人: 张延松 王珊

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种面向列存储数据仓库的多维OLAP查询处理方法。它将OLAP查询分解为位图过滤操作、分组操作和聚集操作。在位图过滤操作中,首先将谓词在维表上执行并生成谓词向量位图,通过代理键地址映射将连接操作转换为直接维表记录访问操作,实现按位置进行访问;在分组操作中,将满足过滤条件的事实表记录按SQL命令中的分组属性预生成分组单元并分配递增的ID;在聚集操作中,通过对事实表度量属性的一趟列扫描实现按事实表过滤分组向量的分组项进行分组聚集计算。本发明只需要对事实表进行一趟列扫描即可完成全部的OLAP处理任务,避免了多次扫描的代价。

    基于数组存储和向量处理的OLAP查询处理方法

    公开(公告)号:CN103631911A

    公开(公告)日:2014-03-12

    申请号:CN201310616688.1

    申请日:2013-11-27

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30592

    摘要: 本发明公开了一种基于数组存储和向量处理的OLAP查询处理方法。在该方法中,根据数据仓库模式中的参照完整性约束对主-外键进行数组下标映射,使维表主键与事实表外键直接映射为数组下标地址,将复杂的模式转换为一个虚拟物化表,为不同的查询提供统一的数据访问视图。OLAP查询被简化为谓词处理、分组处理和聚集处理三个阶段。在谓词处理阶段使用选择向量多趟处理多个谓词在事实表上的选择结果,在分组处理阶段使用分组向量为每一个满足谓词条件的事实表记录分配分组数组下标,在聚集处理阶段使用聚集向量为聚集函数提供基于数组的聚集器。本发明简化了复杂模式下的OLAP查询处理过程,消除了表间的连接操作,提高了OLAP查询处理时的代码执行效率。

    面向数据库与Hadoop混合平台的OLAP查询处理方法

    公开(公告)号:CN102663117B

    公开(公告)日:2013-11-20

    申请号:CN201210114112.0

    申请日:2012-04-18

    发明人: 张延松 王珊

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30592

    摘要: 本发明公开了一种面向数据库与Hadoop混合平台的OLAP查询处理方法。该方法以Hadoop的多复本容错机制为基础,在进行OLAP查询处理时,首先在主工作复本上执行,并将查询处理结果记录于本地数据库的聚集结果表中;当工作节点出现故障时,通过namenode查找主工作复本对应的容错复本的节点信息,并调用MapReduce任务在容错复本上完成OLAP查询处理任务。本发明将数据库技术与Hadoop技术相结合,以双存储引擎、双查询处理引擎的方式将数据库的存储性能和Hadoop的高可扩展性、高可用性进行结合;利用主-从式复本管理机制将数据库查询处理与MapReduce查询处理以松散耦合的方式进行集成,既保证了高查询处理性能,又保证了高容错性能。