一种大规模并行处理架构中的混合数据分布

    公开(公告)号:CN107251023A

    公开(公告)日:2017-10-13

    申请号:CN201680011529.0

    申请日:2016-01-26

    CPC classification number: G06F16/174 G06F16/1858 G06F16/278

    Abstract: 大规模并行处理(massively parallel processing,简称MPP)数据库中的混合分布模式的系统和方法防止由数据倾斜引起的存储不平衡问题。若键的记录导致数据库倾斜,将所述数据库的那些键值视作离群点。在混合模式下,包含离群键值的记录通过随机分布方案进行分布。其他记录通过哈希分布方案进行分布。系统的门限倾斜量是可配置的。记录查询、插入、删除以及更新根据查询计划进行处理,其中该查询计划是针对数据库查询中参考的记录的分布模式进行的优化。

    支持页面隐式锁的共享存储架构中的并发控制

    公开(公告)号:CN106575238B

    公开(公告)日:2021-02-05

    申请号:CN201580030743.6

    申请日:2015-09-24

    Abstract: 提出的系统和方法有利于高效的信息存储管理。一种系统可以包括共享存储器,集中式锁管理器,以及多个节点。一种存储管理方法可以包括:接收信息访问请求,执行锁分解进程,执行访问操作(例如读取,信息更新等)。所述信息可与共享存储组件相关。所述锁分解进程可以包括参与锁管理进程,所述锁管理进程管理物理锁(P‑lock),其中,所述锁管理进程利用与隐式锁进程相关的事务信息,并且在继续进行过程中没有产生与显式逻辑锁请求相关的通信开销。在一个实施例中,所述锁分解进程包括参与冲突确定进程,以确定是否与信息访问请求存在潜在的冲突,其中,所述冲突确定进程利用与隐式锁进程相关的事务信息。

    用于并行化SMP数据库中的基于散列的运算符的系统和方法

    公开(公告)号:CN107710200B

    公开(公告)日:2020-11-06

    申请号:CN201680035441.2

    申请日:2016-03-09

    Abstract: 本发明提供一种用于并行化对称多处理(SMP)数据库中的基于散列的运算符的系统和方法。在实施例中,用于执行基于散列的数据库操作的设备中的方法包含:在所述设备处接收数据库查询;创建多个执行工作线程以处理所述查询;以及由所述执行工作线程根据数据库表构建散列表,所述数据库表包括多个分区和多个扫描单元中的一个,所述散列表由所述执行工作线程共享,每个执行工作线程扫描对应分区并且在分割所述数据库表的情况下将条目添加到所述散列表,每个执行工作线程扫描未处理的扫描单元并且在所述数据库表包括扫描单元的情况下根据所述扫描单元将条目添加到所述散列表,并且所述工作线程以并行方式执行所述扫描和所述添加。

    数据块级别的大数据统计

    公开(公告)号:CN107533551B

    公开(公告)日:2020-08-07

    申请号:CN201680009881.0

    申请日:2016-03-08

    Abstract: 提供一种用于存储分布式文件系统中存储的记录的统计数据的系统和方法。一方面,在数据节点的存储器中分配统计数据块,用于存储所述数据节点的存储磁盘中存储的记录的统计数据。所述数据节点中多个数据块中的每个数据块在所述统计数据块中均有各自的条目,所述统计数据块与所述数据节点中的其他数据块并列在一起。采集所述分布式文件系统中存储的记录的统计数据,并将所述统计数据写入所述数据节点的存储器中的统计数据块。

    在数据库集群中重分布表数据

    公开(公告)号:CN111386521A

    公开(公告)日:2020-07-07

    申请号:CN201880076176.1

    申请日:2018-11-21

    Abstract: 一种用于在分布式数据库中重定位数据的计算机实现方法,包括:通过一个或多个处理器在所述分布式数据库中创建第二表,所述第二表包括第一表中的所有列;通过所述一个或多个处理器将第一组元组从所述第一表复制到所述第二表;在所述复制所述第一组元组期间,通过所述一个或多个处理器根据修改对所述第一表中的数据进行修改;在所述复制所述第一组元组之后,通过所述一个或多个处理器根据所述修改对所述第二表中的数据进行修改;通过所述一个或多个处理器在所述分布式数据库的目录中将所述第一表替换为所述第二表。

    用于分布式大规模并行处理数据库的方法和系统

    公开(公告)号:CN104871153B8

    公开(公告)日:2019-02-01

    申请号:CN201380051321.8

    申请日:2013-10-29

    Abstract: 一种大规模并行处理的实施例方法,包括:将主键分配给数据库中的第一数据表、将外键分配给所述数据库中的第二数据表,所述第二数据表的外键与所述第一数据表的主键完全相同;确定所述数据库需要的分区组数;基于分配的所述主键和需要的分区组数将所述第一数据表划分成多个第一分区,基于分配的所述外键和需要的分区组数将所述第二数据表划分成多个第二分区;根据分区情况将所述第一分区和第二分区分发到所述分区组。本发明还公开了一种实现所述实施例方法的实施例系统。

    用于分布式大规模并行处理数据库的方法和系统

    公开(公告)号:CN104871153B

    公开(公告)日:2018-10-30

    申请号:CN201380051321.8

    申请日:2013-10-29

    Abstract: 一种大规模并行处理的实施例方法,包括:将主键分配给数据库中的第一数据表、将外键分配给所述数据库中的第二数据表,所述第二数据表的外键与所述第一数据表的主键完全相同;确定所述数据库需要的分区组数;基于分配的所述主键和需要的分区组数将所述第一数据表划分成多个第一分区,基于分配的所述外键和需要的分区组数将所述第二数据表划分成多个第二分区;根据分区情况将所述第一分区和第二分区分布到所述分区组。本发明还公开了一种实现所述实施例方法的实施例系统。

Patent Agency Ranking