-
公开(公告)号:CN108369598A
公开(公告)日:2018-08-03
申请号:CN201680073840.8
申请日:2016-10-19
申请人: 甲骨文国际公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30466 , G06F17/30911 , G06F17/30917
摘要: 提供了用于将半结构化层级数据去规范化为虚拟表的技术。在实施例中,半结构化数据文档集合的至少一部分被去规范化,用于改进涉及遍历半结构化数据文档集合的半结构化数据层级的查询的执行。基于提取出的半结构化数据的模式,生成去规范化布置,其中半结构化数据的层级关系被转换为列集合。通过将去规范化布置应用到半结构化数据上,去规范化布置在虚拟表中进行物化。在实施例中,接收到的涉及遍历半结构化数据层级的查询被转换为可以在虚拟表上执行的关系查询。在虚拟表上执行关系查询改进了生成结果数据集的性能。
-
公开(公告)号:CN104769576B
公开(公告)日:2018-03-09
申请号:CN201380050050.4
申请日:2013-09-24
申请人: 洛吉奇布洛克斯公司
发明人: 托德·L·费尔德赫伊曾
CPC分类号: G06F17/30498 , G06F17/30327 , G06F17/30339 , G06F17/30466 , G06F17/30646
摘要: 提出了一种用于连接来自数据库表的记录的方法。将连接属性排序为序列S0,并且将作用域C初始化为空。识别包括连接属性A的表,该连接属性是S0中的第一个。新序列S从S0中删掉A。遍历每个所识别的表的迭代按照连接属性A的顺序进行。该迭代使用针对每个所识别的表的树形索引结构,在该树形索引结构中索引关键字包括按照S0顺序的所识别的表中的所有连接属性。针对在迭代期间定位的连接属性的每个匹配值v,通过将“A=v”附加至作用域C来创建新作用域Cv。如果S为空,则输出对应于作用域Cv的元组。否则,将S0设定为S并且针对每个作用域Cv,将C设定为Cv并且递归调用从识别步骤开始的步骤。
-
公开(公告)号:CN107111617A
公开(公告)日:2017-08-29
申请号:CN201480084094.3
申请日:2014-12-19
申请人: 微软技术许可有限责任公司
发明人: 陈亮
IPC分类号: G06F17/30
CPC分类号: G06F17/30439 , G06F17/30292 , G06F17/30339 , G06F17/30466 , G06F17/30469 , G06F17/30498 , G06F17/30958
摘要: 本文所描述的主题涉及用于实现图处理的数据库中间件。提出了图数据和底层关系数据库或SQL数据库之间的中间件。图中的节点的局部属性和拓扑信息可以存储在数据库中的单个节点表中,从而不再需要物理联接表。中间件可以有效地将图查询转换成对相关表的SQL查询。中间件可以使用不考虑数据库查询引擎的拓扑知识来优化转换后的查询。
-
公开(公告)号:CN106933918A
公开(公告)日:2017-07-07
申请号:CN201511032612.X
申请日:2015-12-31
申请人: 北京国双科技有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30442 , G06F17/30466
摘要: 本申请公开了一种数据表的查询方法和装置。其中,该查询方法包括:获取查询请求中携带的过滤条件,其中,过滤条件用于指示获取不存在其他实体的目标实体信息;基于过滤条件,获取其他实体和目标实体对应的多个数据表;获取多个数据表的表关系,其中,表关系中记录有各个数据表的连接字段;利用连接字段,按照预定连接方式对多个数据表进行反连接,得到查询请求的结果。通过本申请,解决了现有技术查询数据表的效率低的技术问题。
-
公开(公告)号:CN104769586A
公开(公告)日:2015-07-08
申请号:CN201380055344.6
申请日:2013-10-22
申请人: 起元科技有限公司
发明人: 阿伦·安德森
IPC分类号: G06F17/30
CPC分类号: G06F17/30466 , G06F17/30 , G06F17/30303 , G06F17/30321 , G06F17/30371 , G06F17/30424 , G06F17/30569
摘要: 剖析数据包括处理被访问的记录集合(203),包括:对在第一组一个或多个字段上出现的第一组特异值,产生相应的位置信息;对第一组字段,产生相应的条目列表(209),其从第一组特异值中识别一个特异值以及该特异值的位置信息;对第二组一个或多个字段,产生相应的条目列表(209),每个条目从出现在第二组字段的第二组特异值中识别一个特异值;和至少部分基于下述产生结果信息(240):采用出现在第一组字段的至少一个值的位置信息对集合中的至少一个记录进行定位,确定在该被定位记录的第二组字段中所出现的至少一个值。
-
公开(公告)号:CN104391957A
公开(公告)日:2015-03-04
申请号:CN201410710850.0
申请日:2014-12-01
申请人: 浪潮电子信息产业股份有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30395 , G06F17/30315 , G06F17/30466
摘要: 本发明公开了一种针对混合型大数据处理系统的数据交互分析方法,属于大数据分析技术领域,混合型大数据处理系统是基于HBase数据库及基于内存计算引擎的Hive系统构建,交互查询sql语句由客户端发出,包括针对Hive表和HBase表的join操作,其特征在于采用bucketjoin方法进行数据交互,bucketjoin方法包括数据准备过程和运行时执行过程。本发明通过分桶、coprocessr和mapjoin的方式,大大提高了跨Hive和HBase系统的关联分析性能,能够满足行业大数据针对混合处理系统的交互分析业务应用需求。
-
公开(公告)号:CN102197406B
公开(公告)日:2014-10-15
申请号:CN200980142344.3
申请日:2009-10-23
申请人: 起元技术有限责任公司
发明人: 阿伦.安德森
IPC分类号: G06N7/02
CPC分类号: G06F17/30466 , G06F17/30386 , G06F17/30542 , G06F17/30598 , G06F17/30979 , G06N99/005
摘要: 一种用于对存储在数据存储系统中的数据元素进行聚类的方法包括从数据存储系统读取数据元素。形成数据元素的聚类,其中,每一个数据元素是至少一个聚类的成员。将至少一个数据元素与两个或多个聚类相关联。该数据元素的属于所述两个或多个聚类的各自一个的成员资格由不明确性度量表示。将表示所形成的聚类的信息存储在数据存储系统中。
-
公开(公告)号:CN103177056A
公开(公告)日:2013-06-26
申请号:CN201210401219.3
申请日:2012-10-19
申请人: SAP股份公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30345 , G06F17/30312 , G06F17/30339 , G06F17/30442 , G06F17/30466 , G06F17/30477 , G06F17/30584 , G06F17/30867
摘要: 混合数据库表被存储为行存储和列存储二者。一个或多个技术可以单独使用或组合使用,以便通过调节对处理密集型列存储数据的访问和/或调节处理密集型列存储数据的大小来提高混合表的性能。例如,在插入操作过程中,只有在已经考虑了某些过滤和/或边界条件之后才可以针对列存储数据搜索唯一性违背情况。在另一种技术中,混合表管理器可以基于诸如访问频率或者潜在的业务逻辑来控制将数据移动到列存储。在又一种技术中,混合表的查询可以仅在行存储数据的初始搜索没有返回结果之后才导致搜索列存储数据。
-
公开(公告)号:CN1928866A
公开(公告)日:2007-03-14
申请号:CN200610110787.2
申请日:2006-08-08
申请人: 国际商业机器公司
发明人: 傅毓勤 , 林棻玲 , 安德列·弗德罗维奇·卢里耶 , 特伦斯·帕特里克·布尔塞尔 , 过阳一 , 夏立
IPC分类号: G06F17/30
CPC分类号: G06F17/30466 , Y10S707/99932 , Y10S707/99933 , Y10S707/99934
摘要: 本发明提供了一种用于处理包括多个半连接的查询的技术。在执行时,从用于在当前半连接执行周期中执行的半连接中选择下一个半连接。确定一个报告阈值,该阈值指明了针对所确定的半连接要检取的记录标识符的数目。执行所选择的半连接,直到检取到所确定数目个记录标识符为止。
-
公开(公告)号:CN108885641A
公开(公告)日:2018-11-23
申请号:CN201780021857.3
申请日:2017-03-27
申请人: 微软技术许可有限责任公司
发明人: B·钱德拉莫利 , R·卡斯特罗·费尔南德兹 , A·H·夸玛 , A·艾尔达维 , J·D·戈尔德斯泰恩
IPC分类号: G06F17/30
CPC分类号: G06F17/30466 , G06F17/30424 , G06F17/30474 , G06F17/30551
摘要: 高性能查询处理和数据分析可以跨架构上不同的规模而被执行,诸如单核、多核和/或多节点。高性能查询处理和数据分析可以包括查询计算、密钥化数据、数据移动和并行计算的分离,由此增强查询处理和数据分析的能力,同时允许指定数据并行计算的复杂形式,数据并行计算可以跨实时和离线来执行。如本文所述,数据移动和并行计算的去耦合可以改善查询处理和数据分析速度,可以提供多个计算环境中的搜索的优化,并且可以提供搜索执行计划的更大空间的能力。
-
-
-
-
-
-
-
-
-