数据查询方法、装置及系统

    公开(公告)号:CN102054000B

    公开(公告)日:2012-07-25

    申请号:CN200910236742.3

    申请日:2009-10-28

    Abstract: 本发明公开一种数据查询方法、装置及系统,用以满足用户在对数据进行查询时对数据范围和查询频率的需求。该方法包括步骤:数据查询服务器获得用户提供的数据查询条件,并根据所述数据查询条件,确定对应的数据信息;根据所述确定的数据信息、按照预设的采样规则预先从数据管理系统的各区服务器管理的数据中采样得到的采样数据,确定数据查询策略,其中,所述预设的采样规则为按照对所述管理的数据进行采样的时间点与生成所述管理的数据的时间点的时间差由大至小的顺序,对应采用由小至大的预设采样率,对所述各区服务器管理的数据进行采样;所述数据查询服务器根据所述确定的数据查询策略,查询与所述数据信息相对应的数据。

    分布式数据库系统、在其中建立索引的方法和查询方法

    公开(公告)号:CN102375853A

    公开(公告)日:2012-03-14

    申请号:CN201010261167.5

    申请日:2010-08-24

    Abstract: 公开了一种分布式数据库系统和在分布式数据库系统中建立索引的方法。分布式数据库系统包括:多个分布式存储单元,分区存储有多个数据块文件;索引存储器,存储有所述多个数据块文件的索引;解析器,解析用户发起的查询语句,并选择相应的查询索引;索引查询模块,根据选择的查询索引,搜索所述多个数据块文件的索引以获得至少一个查询数据块集,所述查询数据块集包括索引键值、和记录了所述多个数据块文件中与所述索引键值对应的数据块文件的位置信息;以及并行处理引擎,将所述至少一个查询数据块集拆分并发起并行扫描任务。

    移动网络中广告的投放方法、系统和广告信息控制服务器

    公开(公告)号:CN101552958A

    公开(公告)日:2009-10-07

    申请号:CN200810103248.5

    申请日:2008-04-01

    CPC classification number: H04L67/20

    Abstract: 本发明公开了一种移动网络中广告的投放方法,该方法包括:广告信息控制服务器接收业务平台上报的广告位信息,其中,广告位信息是业务信息中可携带的广告数据的属性信息;接收与广告位信息对应的广告数据,并发送给上报该广告位信息的业务平台;所述业务平台发送携带所述广告数据的业务信息。通过本发明,解决了广告主需要分别针对每一个业务平台投放广告数据,并且针对支持不同类型广告数据的业务平台投放不同类型的广告数据的问题,可以在多种业务渠道下发广告数据,使广告发布过程简便高效、易于扩展、提高广告主体验。本发明还公开了一种移动网络中广告的投放系统和广告信息控制服务器。

    一种数据加载方法和装置
    44.
    发明授权

    公开(公告)号:CN108121745B

    公开(公告)日:2021-08-06

    申请号:CN201611085703.4

    申请日:2016-11-30

    Abstract: 本发明实施例提供一种数据加载方法,该方法包括:根据需要加载的数据的主键字段对需要加载的数据排序,并生成数据文件;对排序后的需要加载的数据的主键字段采样,生成第一主键字段;根据第一主键字段生成数据表的分区信息,并根据数据表的分区信息对数据表进行分区;根据数据表的分区信息对数据文件进行分组,并根据分组结果生成数据表的分区文件;将数据表的分区文件加载到对应的数据表的分区中。本发明实施例同时还提供一种数据加载装置。

    一种基于MapReduce的数据处理方法和装置

    公开(公告)号:CN104978345B

    公开(公告)日:2018-08-17

    申请号:CN201410140407.4

    申请日:2014-04-09

    Abstract: 本发明公开了一种基于MapReduce的数据处理方法和装置,用以解决现有技术中的MapReduce流程在处理数据时会频繁进行磁盘读写操作从而造成额外开销,严重影响系统性能的问题。该方法包括:确定针对欲处理数据所要执行的第一MapReduce流程;所述第一MapReduce流程中包含多个MapReduce作业;将所述第一MapReduce流程中满足预先设置的合并规则的MapReduce作业进行合并,得到第二MapReduce流程;其中,所述合并规则满足:合并前的MapReduce作业的执行结果与合并后的MapReduce作业的执行结果相同;对所述预处理数据执行所述第二MapReduce流程。

    一种数据分析的方法和装置

    公开(公告)号:CN108268558A

    公开(公告)日:2018-07-10

    申请号:CN201710002591.X

    申请日:2017-01-03

    Abstract: 本发明实施例公开了一种数据分析的方法和装置;该方法包括:构建原始数据元数据与脱敏数据元数据之间的映射关系;在确定数据使用请求合法后,将所述数据使用请求中用于执行数据操作的原始结构化查询语言SQL语句进行解析;当所述原始SQL语句针对脱敏数据时,根据所述映射关系将所述SQL语句进行转换;通过所述转换后的SQL语句对所述脱敏数据对应的原始数据进行关联分析;根据所述关联分析的数据结果进行数据分析,并将所述数据分析的结果进行返回。能够在保证敏感数据安全的同时,还能够使得脱敏后的数据仍然保持对应的原始数据的数据分析价值和使用价值。

    一种上网偏好用户群体的确定方法和设备

    公开(公告)号:CN104750752B

    公开(公告)日:2018-06-15

    申请号:CN201310752439.5

    申请日:2013-12-31

    Abstract: 本发明实施例公开了一种上网偏好用户群体的确定方法和设备,通过应用本发明实施例所提出的技术方案,在需要确定上网偏好用户群体时,根据上网偏好用户群体所对应的关键词确定相应的目标URL,并结合该目标URL所对应的倒排索引信息,确定对该目标URL的访问次数符合用户筛选条件的各用户标识所对应的用户组成该上网偏好用户群体,从而,充分利用倒排索引信息高性能、高灵活度的特征,实现上网偏好用户群体的快速获取,避免了大量数据记录和匹配所带来的系统资源的消耗,提高了上网偏好用户群体确定过程的处理效率和筛选准确度。

    一种查询处理方法、装置及系统

    公开(公告)号:CN104750690B

    公开(公告)日:2018-03-23

    申请号:CN201310728889.0

    申请日:2013-12-25

    Abstract: 本发明公开了一种查询处理方法、装置及系统,包括:查询路由器将待处理的查询请求发送给多个查询引擎;接收每个查询引擎发送的对该查询请求进行处理的预判响应时间,该预判响应时间为查询引擎根据自身对应的存储引擎中存储的数据表的属性信息,预判的通过扫描该数据表对该查询请求进行处理所需的时间;向预判响应时间最小的查询引擎发送对该查询请求的处理指令。采用本发明实施例提供的方案,相比现有技术,提高了对查询的处理效率。

    一种数据处理方法及系统
    50.
    发明授权

    公开(公告)号:CN103902544B

    公开(公告)日:2017-11-21

    申请号:CN201210571950.0

    申请日:2012-12-25

    Abstract: 本发明提供了一种数据处理方法及系统,这种方法可以将大规模数据按照多个列分割成更细粒度的多维数据块,从而在针对数据查询时仅处理少数相关的数据块。本发明中的数据块是包括所有数据列(可不包含分区列)的数据块,这和现有的列数据库、列族数据库均不相同。这样在输出较多列时,可以获得更好的数据扫描性能。

Patent Agency Ranking