-
公开(公告)号:CN105095008B
公开(公告)日:2018-04-17
申请号:CN201510528462.5
申请日:2015-08-25
Applicant: 国电南瑞科技股份有限公司 , 国电南瑞南京控制系统有限公司 , 国家电网公司 , 国网江苏省电力公司 , 南京南瑞集团公司
IPC: G06F11/07
Abstract: 本发明公开了一种适用于集群系统的分布式任务故障冗余方法,提供了一种两级任务故障冗余功能,达到提升任务高可靠性、系统高可用性以及用户友好性的目的。本发明所达到的有益效果:1、任务的可靠性提高,分布式任务在集群中运行故障时可以在节点内、节点间及时恢复,提高了集群分布式任务的可靠性;2、系统的可用性提高,管理程序采用了主备冗余技术,且任务故障冗余管理对于用户来说是透明的,用户在使用过程中感觉不到任务故障冗余的存在;3、可移植性好,不需要借助任何操作系统自带软件;4、具有跨平台能力,服务程序可以部署在不同的操作系统服务器上;5、使用简单,用户只需要调用几个接口即可使用故障冗余。
-
公开(公告)号:CN105159769A
公开(公告)日:2015-12-16
申请号:CN201510579836.6
申请日:2015-09-11
Applicant: 国电南瑞科技股份有限公司 , 国电南瑞南京控制系统有限公司
Abstract: 本发明公开了一种适用于计算能力异构集群的分布式作业调度方法,包括五个步骤:第一,节点资源的自动化发现;集群中的每个节点将资源信息以组播报文的方式发送到网络中,调度器接收组播报文,自动发现集群节点;第二,基于FIFO和资源利用最大化的作业调度机制。第三,基于数据集的动态再调度机制。作业管理器动态调整各个任务的数据集;第四,延迟调度机制。将作业的部分任务部署到所有节点,剩下的任务提交到延迟队列等待调度。第五,使用冗余互备机制。调度器为每个任务部署备份任务,保证在任务故障或者离线后,备份任务依然能够提供计算结果。本发明提高了集群的分布式处理能力,提升了系统的资源利用率,确保了作业处理的可靠性。
-
公开(公告)号:CN105159769B
公开(公告)日:2018-06-29
申请号:CN201510579836.6
申请日:2015-09-11
Applicant: 国电南瑞科技股份有限公司 , 国电南瑞南京控制系统有限公司 , 国家电网公司 , 江苏省电力公司 , 南京南瑞集团公司
Abstract: 本发明公开了一种适用于计算能力异构集群的分布式作业调度方法,包括五个步骤:第一,节点资源的自动化发现;集群中的每个节点将资源信息以组播报文的方式发送到网络中,调度器接收组播报文,自动发现集群节点;第二,基于FIFO和资源利用最大化的作业调度机制。第三,基于数据集的动态再调度机制。作业管理器动态调整各个任务的数据集;第四,延迟调度机制。将作业的部分任务部署到所有节点,剩下的任务提交到延迟队列等待调度。第五,使用冗余互备机制。调度器为每个任务部署备份任务,保证在任务故障或者离线后,备份任务依然能够提供计算结果。本发明提高了集群的分布式处理能力,提升了系统的资源利用率,确保了作业处理的可靠性。
-
公开(公告)号:CN105139130A
公开(公告)日:2015-12-09
申请号:CN201510533368.9
申请日:2015-08-27
Applicant: 国电南瑞科技股份有限公司 , 国电南瑞南京控制系统有限公司
Abstract: 本发明公开了一种适用于电力系统分布式任务的管理方法,其特征是,包括以下步骤:1)分布式任务的初始化:将待处理的数据集分成大小均衡的数据块,将数据块和任务部署到活跃节点上;2)分布式任务的运行管理:提供故障冗余、负载均衡、手动任务停止和任务切换功能;3)计算节点的状态管理:离线后,任务会自动迁移到其它节点运行;恢复后,高负载节点的任务自动迁移到该节点上;4)分布式任务的结果汇总:支持单节点、全系统、区域汇总三种方式。本发明所达到的有益效果:1、处理能力高,电力应用的任务完全分布式并发运行;2、可靠性高,任意任务实例或者计算节点故障都不影响任务的完成;3、资源使用率高,各个节点都为任务完成提供计算能力。
-
公开(公告)号:CN105095008A
公开(公告)日:2015-11-25
申请号:CN201510528462.5
申请日:2015-08-25
Applicant: 国电南瑞科技股份有限公司 , 国电南瑞南京控制系统有限公司
IPC: G06F11/07
Abstract: 本发明公开了一种适用于集群系统的分布式任务故障冗余方法,提供了一种两级任务故障冗余功能,达到提升任务高可靠性、系统高可用性以及用户友好性的目的。本发明所达到的有益效果:1、任务的可靠性提高,分布式任务在集群中运行故障时可以在节点内、节点间及时恢复,提高了集群分布式任务的可靠性;2、系统的可用性提高,管理程序采用了主备冗余技术,且任务故障冗余管理对于用户来说是透明的,用户在使用过程中感觉不到任务故障冗余的存在;3、可移植性好,不需要借助任何操作系统自带软件;4、具有跨平台能力,服务程序可以部署在不同的操作系统服务器上;5、使用简单,用户只需要调用几个接口即可使用故障冗余。
-
公开(公告)号:CN104077181B
公开(公告)日:2017-08-29
申请号:CN201410292893.1
申请日:2014-06-26
Applicant: 国电南瑞科技股份有限公司 , 广东电网有限责任公司电力调度控制中心
IPC: G06F9/46
Abstract: 本发明公开了一种适用于分布式任务管理系统的状态一致性维护方法,包括以下步骤,1),分布式任务管理系统节点状态的维护;2),分布式任务管理系统的任务初始化;3),分布式任务管理系统的任务状态改变;4),节点故障和恢复的处理。本发明的适用于分布式任务管理系统的状态一致性维护方法,自动化程度高、可靠性高、鲁棒性高、通信效率高、占用带宽小、可移植性好,任务部署简单,具有良好的应用前景。
-
公开(公告)号:CN104077181A
公开(公告)日:2014-10-01
申请号:CN201410292893.1
申请日:2014-06-26
Applicant: 国电南瑞科技股份有限公司
IPC: G06F9/46
Abstract: 本发明公开了一种适用于分布式任务管理系统的状态一致性维护方法,包括以下步骤,1)分布式任务管理系统节点状态的维护;2)分布式任务管理系统的任务初始化;3)分布式任务管理系统的任务状态改变;4)节点故障和恢复的处理。本发明的适用于分布式任务管理系统的状态一致性维护方法,自动化程度高、可靠性高、鲁棒性高、通信效率高、占用带宽小、可移植性好,任务部署简单,具有良好的应用前景。
-
-
-
-
-
-