异构集群调度方法及装置、电子设备和存储介质

    公开(公告)号:CN119781913A

    公开(公告)日:2025-04-08

    申请号:CN202411731484.7

    申请日:2024-11-28

    Applicant: 清华大学

    Abstract: 本公开涉及一种异构集群调度方法及装置、电子设备和存储介质,该方法包括:获取满足应答条件的至少一个第一内核的资源占用情况;基于各资源占用情况,对各所述第一内核进行排序,得到内核调度顺序;获取客户端提交的至少一个待完成任务,基于执行各待完成任务的资源需求,对各待完成任务进行排序,得到任务执行顺序;基于所述内核调度顺序、所述任务执行顺序,确定各待完成任务对应的目标第一内核;将各待完成任务分配给各自对应的目标第一内核。使用本公开的方法可以提高集群计算资源的利用率,降低任务阻塞的概率。使得机器学习的训练和推理过程,可以不依赖特定的芯片,提高了机器模型的灵活性和可移植性,也使得集群的负载更加均衡。

Patent Agency Ranking