一种作业调度管理方法、调度中心和系统
摘要:
本发明公开了一种作业调度管理方法,适于在调度中心中执行,所述调度中心分别与客户端和计算集群相连接,所述计算集群具有至少一个计算节点,每个计算节点具有至少一个GPU显卡,该方法包括步骤:接收由客户端发送的作业提交指令,该指令包含所提交作业的计算要求,具体包括计算节点数m和每个计算节点的GPU显卡数n;获取计算集群的当前空闲资源,并在当前空闲资源中选出与该计算要求相匹配的计算资源;以及将所匹配的计算资源分配给该作业,并在运行作业之前,获取并关联存储该作业的作业标识、所分配的作业计算节点标识、以及作业计算节点中用于运行该作业的GPU显卡序号,以便后续查询使用。本发明还一并公开了相应的调度中心和系统。
公开/授权文献
0/0