-
公开(公告)号:CN101751415B
公开(公告)日:2012-03-28
申请号:CN200810224708.X
申请日:2008-12-09
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种元数据服务系统、元数据同步方法和写服务器更新方法。本发明提供的元数据服务系统,包括:写服务器和读服务器;所述写服务器用于存储并行文件系统中的元数据,接受读访问;以及接受写访问,修改并行文件系统中的元数据,并将修改后的元数据同步更新到读服务器;读服务器,用于存储元数据,接受读访问;以及接受写服务器对元数据的同步更新;还用于当监测到所述写服务器失效时,转换为写服务。本发明通过读服务器和写服务器彼此互为备份,解决单点失效问题,并可满足高效率的大量并发访问需求。
-
公开(公告)号:CN102387173A
公开(公告)日:2012-03-21
申请号:CN201010270583.1
申请日:2010-09-01
Applicant: 中国移动通信集团公司
IPC: H04L29/08
Abstract: 本发明提供了一种MapReduce系统及其调度任务的方法和装置。该方法包括:预先配置多种调度器、将系统资源划分为多个资源子网,并预先配置所述调度器与所述资源子网的对应关系;其中,每种调度器包括任务队列和调度策略;接收工作节点的任务请求,从该工作节点所在的资源子网对应的所有调度器中选择调度器,根据选出的调度器的调度策略从该调度器的任务队列中调度任务,将调度出的任务返回给该工作节点。应用本发明能够提高系统进行任务调度的灵活性,增加了系统的适用场景。
-
公开(公告)号:CN102130759A
公开(公告)日:2011-07-20
申请号:CN201010034161.4
申请日:2010-01-13
Applicant: 中国移动通信集团公司
Abstract: 本发明提供一种数据采集方法、数据采集机集群及数据采集机,属于通信技术领域,该方法应用于数据采集机集群中,该方法包括:数据采集机集群中的第一数据采集机进行数据采集,并将采集的数据存储到所述数据采集机集群的分布式文件系统中;当第一数据采集机发生故障时,由数据采集机集群中的第二数据采集机替换第一数据采集机进行数据采集,第二数据采集机采集的数据存储到数据采集机集群的分布式文件系统中,能够有效保证采集数据的完整性。
-
公开(公告)号:CN101471845B
公开(公告)日:2011-06-15
申请号:CN200710304714.1
申请日:2007-12-27
Applicant: 中国移动通信集团公司
Abstract: 本发明涉及一种数据块副本数量调整方法及元数据服务器节点,其中方法包括:元数据服务器节点查询一数据块副本的副本调整信息;当所述副本调整信息中设定的副本调整时刻达到时,根据所述副本调整信息中与该副本调整时刻相应的副本调整数对保存在数据块节点中的所述数据块副本的副本数量进行调整。元数据服务器节点包括:元数据处理模块和副本管理模块。通过本发明,可以对响应时间很长或访问频率高的数据块设置更多的副本数量,以提高用户访问这些数据的聚合带宽,从而在保证数据块的可用性及可靠性的同时,提高了系统资源的利用效率。
-
公开(公告)号:CN102054001A
公开(公告)日:2011-05-11
申请号:CN200910236744.2
申请日:2009-10-28
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据挖掘系统中数据预处理的方法、系统及装置,其中,数据预处理对应具有设定执行次序的多个预处理方式,主要技术方案包括:确定数据预处理对应的当前预处理方式;在确定若根据当前预处理方式处理得到的处理结果无需合并并且当前预处理方式不为数据预处理的最后一个预处理方式时,在各操作节点根据当前预处理方式处理待处理数据后,控制各操作节点对得到的处理结果根据当前预处理方式的下一预处理方式进行处理。根据该技术方案,减少了不同节点之间由于待处理数据的读取以及处理结果的写入而需要的传输过程,提高了数据挖掘系统中数据预处理的效率,提高了整个数据挖掘系统的性能。
-
公开(公告)号:CN102054000A
公开(公告)日:2011-05-11
申请号:CN200910236742.3
申请日:2009-10-28
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开一种数据查询方法、装置及系统,用以满足用户在对数据进行查询时对数据范围和查询频率的需求。该方法包括步骤:数据查询服务器获得用户提供的数据查询条件,并根据所述数据查询条件,确定对应的数据信息;根据所述确定的数据信息、按照预设的采样规则预先从数据管理系统的各区服务器管理的数据中采样得到的采样数据,确定数据查询策略,其中,所述预设的采样规则为按照对所述管理的数据进行采样的时间点与生成所述管理的数据的时间点的时间差由大至小的顺序,对应采用由小至大的预设采样率,对所述各区服务器管理的数据进行采样;所述数据查询服务器根据所述确定的数据查询策略,查询与所述数据信息相对应的数据。
-
公开(公告)号:CN101799807A
公开(公告)日:2010-08-11
申请号:CN200910077659.6
申请日:2009-02-10
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种异构数据表的合并方法及其系统,本发明方法包括:为多个异构数据表分别分配表标识,并将表标识添加到相应数据表中的所有数据记录;根据设置的关键字字段,将具有相同关键字字段值但具有不同表标识的数据记录合并为新的数据记录,并将所述新的数据记录中的表标识删除;将删除了表标识的数据记录存储到新的数据表中。采用本发明,可实现异构数据表的数据合并处理,并可提高数据合并操作的效率。
-
公开(公告)号:CN101799748A
公开(公告)日:2010-08-11
申请号:CN200910077994.6
申请日:2009-02-06
Applicant: 中国移动通信集团公司
Abstract: 本发明公开了一种确定数据样本的类别的方法及其系统。本发明方法包括:并行执行多个第一Map任务,其中,每个Map任务获取待分类数据样本集中的部分数据样本,计算该部分数据样本中每个数据样本与训练样本集中的训练样本的相似度,并针对每个数据样本取降序排序的前K个相似度所对应的类别;执行Reduce任务,所述Reduce任务分别对每个数据样本的K个相似度所对应的类别进行汇总,将每个数据样本中占多数的类别确定为该数据样本的类别。采用本发明,可提高数据样本分类处理的效率。
-
公开(公告)号:CN101471863A
公开(公告)日:2009-07-01
申请号:CN200710304165.8
申请日:2007-12-25
Applicant: 中国移动通信集团公司
Abstract: 本发明涉及一种网络间数据处理方法、装置及其转换网关。方法包括:接收从存储区域网络传输的FC帧,从所述FC帧中获取FCP服务优先级;根据预先设置的服务优先级映射表,获取与所述FCP服务优先级相对应的IP服务优先级;将所述FC帧封装成包括所述IP服务优先级的IP数据包,使所述IP数据包以所述IP服务优先级在IP网络中传输。装置包括:第一接收模块、第一解析模块、第一分类模块、第一封装模块、第一发送模块和第一映射模块。本发明实现了两个网络之间服务优先级的转换,使数据在整个传输过程中具有相应服务优先级,保证了网络之间数据传输的服务质量保证。
-
公开(公告)号:CN101471845A
公开(公告)日:2009-07-01
申请号:CN200710304714.1
申请日:2007-12-27
Applicant: 中国移动通信集团公司
Abstract: 本发明涉及一种数据块副本数量调整方法及元数据服务器节点,其中方法包括:元数据服务器节点查询一数据块副本的副本调整信息;当所述副本调整信息中设定的副本调整时刻达到时,根据所述副本调整信息中与该副本调整时刻相应的副本调整数对保存在数据块节点中的所述数据块副本的副本数量进行调整。元数据服务器节点包括:元数据处理模块和副本管理模块。通过本发明,可以对响应时间很长或访问频率高的数据块设置更多的副本数量,以提高用户访问这些数据的聚合带宽,从而在保证数据块的可用性及可靠性的同时,提高了系统资源的利用效率。
-
-
-
-
-
-
-
-
-