一种数据处理方法和装置

    公开(公告)号:CN104657388A

    公开(公告)日:2015-05-27

    申请号:CN201310597967.8

    申请日:2013-11-22

    发明人: 吕春建

    IPC分类号: G06F17/30

    CPC分类号: G06F16/278 G06F16/24535

    摘要: 本申请涉及一种数据处理方法和装置。其中,该方法包括:扫描存储于数据库表中的一个或多个数据;基于扫描,对一个或多个数据中的重复数据进行计数,确定每个重复数据的计数值;根据每个重复数据和每个重复数据的计数值,计算与分析数据分布相关的结果。本申请的方法和装置基于重复数据,避免了对所有数据扫描,有效降低计算机IO,显著减少运算数据量,提高运算效率并缩短数据处理时间、减轻计算机运行的负担,并且,利用分位数区间快速的获得分位数降低了计算开销。由此,解决了提高计算机数据处理过程中的运算性能、提高计算效率的问题。

    一种手机号码的存储方法及查询方法

    公开(公告)号:CN106777178A

    公开(公告)日:2017-05-31

    申请号:CN201611198829.2

    申请日:2016-12-22

    IPC分类号: G06F17/30

    CPC分类号: G06F16/24535

    摘要: 本发明公开了一种手机号码的存储方法及查询方法,存储方法包括依据预设规则将手机号码按照号段和号尾分成两部分,并以号段和号尾组成的键值对构建存储区域;当接收到待存储手机号码时,依据预设规则解析待存储手机号码对应的目标号段和目标号尾;在存储区域中查找到目标号段的位置,并将目标号尾存储在目标号段对应的区域中。由于通过键值对将手机号码的号段和号尾关联起来,因此,当多个手机号码具有相同的键时,作为键的那部分数据可以只存储一次即可。另外,在进行数据查询时,可以依据键进行查询,如果没有对应的键,则也就无需继续查找,因此节约了查询时间。

    一种查询编译方法和装置

    公开(公告)号:CN108470072A

    公开(公告)日:2018-08-31

    申请号:CN201810298547.2

    申请日:2018-03-30

    发明人: 张隽

    IPC分类号: G06F17/30

    CPC分类号: G06F16/283 G06F16/24535

    摘要: 本说明书实施例提供一种查询编译方法和装置,其中方法包括:在执行部分查询计划之前,JIT引擎判断部分查询计划是否满足JIT处理条件,所述部分查询计划由主节点分配至所述JIT引擎所在的计算节点,且所述部分查询计划是主节点根据查询请求生成的查询计划的一部分;若所述部分查询计划满足所述JIT处理条件,则JIT引擎对所述部分查询计划执行JIT处理,以得到执行结果;否则,所述JIT引擎将所述部分查询计划发送至非JIT引擎,以使得所述非JIT引擎执行所述部分查询计划。

    优化视图上的查询的系统和方法

    公开(公告)号:CN107077512A

    公开(公告)日:2017-08-18

    申请号:CN201680003292.1

    申请日:2016-03-17

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种优化视图上查询的系统和方法。本发明提供一种用于处理查询的数据处理系统,所述数据处理系统包括:耦合至存储器的处理器,所述存储器存储多个指令用于指示所述处理器接收包括视图上一部分查询的查询;基于所述视图上一部分查询检查系统表,其中,所述系统表包括指示所述视图的所述编译的与所述视图关联的状态;以及如果在所述系统表中发现所述视图上一部分查询,提取共享对象文件,所述共享对象文件存储与所述视图上一部分查询关联的至少一个编译函数;将编所述译函数用作一部分查询执行计划;以及执行所述查询执行计划以显示结果。

    创建数据库表的样本的方法、系统和计算机可读存储介质

    公开(公告)号:CN105493085B

    公开(公告)日:2019-06-18

    申请号:CN201480046615.6

    申请日:2014-06-26

    IPC分类号: G06F16/2453 G06F16/22

    摘要: 用于查询大小估计的显著性采样包括识别出一数据库表中的两个或更多列,其在一个或多个其他表中具有相应的列。对所识别出的列中的每一列的域应用一个或多个散列函数。对第一列的域应用第一散列函数,并且对第二列的域应用第二散列函数。选择数据库表中的行的子集。所述选择包括选择数据库表中的其中第一散列函数的结果满足第一数值阈值的各行,以及选择数据库表中的其中第二散列函数的结果满足第二数值阈值的各行。创建对应于数据库表的样本数据库表。所述样本数据库表包括数据库表中的行的所选子集。

    数据查询方法及系统
    6.
    发明公开

    公开(公告)号:CN106021570A

    公开(公告)日:2016-10-12

    申请号:CN201610378668.9

    申请日:2016-05-31

    IPC分类号: G06F17/30

    摘要: 本申请是关于数据查询方法及系统,所述方法包括:获取查询请求,所述查询请求中包括查询条件;通过预设的文件索引中确定是否存在满足所述查询条件的数据;若不存在满足所述查询条件的数据,则结束查询;若存在满足所述查询条件的数据,利用预设的数据索引在原始数据文件中查找出满足所述查询条件的数据。本申请实施例先通过文件索引快速地判断是否存在满足条件的数据,当不存在时,则可结束查询,因此能有效地提高查找效率。

    一种数据库的查询方法和装置

    公开(公告)号:CN106156197A

    公开(公告)日:2016-11-23

    申请号:CN201510194014.6

    申请日:2015-04-22

    发明人: 尹久元

    IPC分类号: G06F17/30

    CPC分类号: G06F16/00 G06F16/24535

    摘要: 本发明实施例公开了一种数据库的查询方法和装置,该方法可以包括:数据库根据待处理数据所满足的结构规则对所述待处理数据进行拆分,得到子数据以及子数据在所述待处理数据中的位置;所述数据库接收待查询数据;所述数据库从所述子数据以及所述子数据在所述待处理数据中的位置获取所述待查询数据在所述待处理数据中的位置。

    一种数据管理方法及装置

    公开(公告)号:CN105868421A

    公开(公告)日:2016-08-17

    申请号:CN201610411529.1

    申请日:2016-06-12

    发明人: 裴广恩 丁雪松

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种数据管理方法及装置,其中,方法包括:S1:接收对应目标数据库表的数据拆分指令,其中,数据拆分指令携带数据拆分策略;S2:根据数据拆分指令,在外部数据库中构建业务分表,其中,业务分表的结构与目标数据库表的结构相同;S3:根据数据拆分策略将目标数据库表中存储的至少一个第一目标业务数据迁移至业务分表;S4:根据数据拆分策略配置业务分表和目标数据库表分别对应的属性信息;S5:接收携带数据查询条件的查询请求指令;S6:确定对应查询条件的目标属性信息,从对应目标属性信息的目标业务分表或目标数据库表中获取第二目标业务数据。通过本发明的技术方案,可提高用户体验。

    用于查询大小估计的显著性采样

    公开(公告)号:CN105493085A

    公开(公告)日:2016-04-13

    申请号:CN201480046615.6

    申请日:2014-06-26

    IPC分类号: G06F17/30

    摘要: 用于查询大小估计的显著性采样包括识别出一数据库表中的两个或更多列,其在一个或多个其他表中具有相应的列。对所识别出的列中的每一列的域应用一个或多个散列函数。对第一列的域应用第一散列函数,并且对第二列的域应用第二散列函数。选择数据库表中的行的子集。所述选择包括选择数据库表中的其中第一散列函数的结果满足第一数值阈值的各行,以及选择数据库表中的其中第二散列函数的结果满足第二数值阈值的各行。创建对应于数据库表的样本数据库表。所述样本数据库表包括数据库表中的行的所选子集。