资源需求感知的多队列调度方法、系统及服务器

    公开(公告)号:CN113407313B

    公开(公告)日:2022-05-17

    申请号:CN202011357682.3

    申请日:2020-11-27

    IPC分类号: G06F9/48 G06F9/50 G06F9/54

    摘要: 本发明提供一种资源需求感知的多队列调度方法、系统及服务器,所述方法包括:获取用户提交的任务,并判断任务为CPU任务或GPU任务;在任务为GPU任务时,基于调整CPU核数并检查GPU利用率确定最优的CPU配置,进入GPU任务任务调度;在任务为CPU任务时,直接进入CPU任务调度;执行GPU任务调度:对CPU资源划进行划分,并根据当前CPU任务队列和GPU任务队列的排队状况调整CPU资源队列;对GPU资源划进行划分,并根据当前GPU任务队列的排队状况调整GPU资源队列;消除GPU任务与CPU任务在同一个节点上的内存系统的竞争。本发明可以在无需用户感知的前提下,最大化系统的吞吐和最小化系统的排队。