用于深度学习框架的资源调度方法和装置
摘要:
本申请公开了一种用于深度学习框架的资源调度方法和装置。方法包括:间隔预定时间,从Kubernetes平台查询所有的深度学习作业对象的状态;响应于从各个深度学习作业对象中查询到状态符合提交资源请求状态的深度学习作业对象,向Kubernetes平台提交资源请求,以调度Kubernetes平台所处的物理机启动深度学习训练任务。该方法能够完全自动化处理深度学习训练任务的资源分配与释放。
公开/授权文献
0/0