发明公开
- 专利标题: 作业调度方法、装置、存储介质及电子设备
-
申请号: CN202410021030.4申请日: 2024-01-05
-
公开(公告)号: CN117950832A公开(公告)日: 2024-04-30
- 发明人: 那琼澜 , 李信 , 邢宁哲 , 王艺霏 , 温馨 , 张海明 , 陈重韬 , 彭柏 , 邢海瀛 , 刘昀 , 于然 , 纪雨彤 , 吴舜 , 来骥 , 张实君 , 李墨洋
- 申请人: 国网冀北电力有限公司信息通信分公司 , 国家电网有限公司
- 申请人地址: 北京市西城区枣林前街32号;
- 专利权人: 国网冀北电力有限公司信息通信分公司,国家电网有限公司
- 当前专利权人: 国网冀北电力有限公司信息通信分公司,国家电网有限公司
- 当前专利权人地址: 北京市西城区枣林前街32号;
- 代理机构: 北京鼎佳达知识产权代理事务所
- 代理商 刘铁鸣; 刘铁生
- 主分类号: G06F9/48
- IPC分类号: G06F9/48 ; G06F9/50
摘要:
本申请公开了一种作业调度方法、装置、存储介质及电子设备,涉及计算机技术领域。方法包括:接收深度学习训练作业模型;根据深度学习训练作业模型配置状态集和动作集,状态集包括深度学习训练作业模型所需节点的数量、每个节点所需要的GPU数量和深度学习训练作业模型的特征,动作集用于指示深度学习训练作业模型可以占用的GPU的位置信息;构建DQN神经网络,根据状态集、动作集和奖励值确定DQN神经网络的网络参数;基于网络参数确定深度学习训练作业模型对应的目标节点和目标GPU;将深度学习训练作业模型调度至目标节点和目标GPU。将作业调度与深度学习训练作业模型的特征相结合,以最佳资源位置执行深度学习训练作业,提高了计算效率和资源利用率。