一种适用于网格环境的基于可靠性代价的作业调度系统
摘要:
本发明为一种适用于网格环境的基于可靠性代价的作业调度系统。如图1所示,整个系统分为三层:第一层为作业提交接口模块1,第二层为作业调度模块2,以及底层为网格资源平台7。从工作原理上说,本发明的核心为第二层的作业调度模块,它包括预调度模块3、调度决策模块4、作业完成时间预测模块5和资源信息模块6。本发明系统提出作业运行时间预测模型和资源可用性预测模型。作业运行时间预测模型基于数学模型,资源可用性预测模型基于马尔科夫模型,具有很高的准确性和通用性。本发明系统根据作业服务质量需求和资源特点的不同分别采用复制容错策略、主副本异步运行复制容错策略和重试容错策略,具有很高的灵活性和有效性。同时,本发明系统支持计算密集型作业和数据密集型作业,具有很好的通用性。本发明与现有的调度系统相比,具有支持更多的并发用户、提高资源的利用率、通用性好、可扩展性好、系统吞吐率高等优点。
0/0