共享GPU的管理调度架构、管理调度方法及使用方法
Abstract:
本发明公开了一种共享GPU的管理调度架构、管理调度方法及使用方法,使用容器管理平台对GPU服务器资源进行统一管理。其中,管理调度架构包括:资源添加层,用于添加GPU服务器;资源部署层,包括资源集群,用于将GPU服务器资源分配给资源集群;资源配置层,用于为用户提供创建GPU应用和设置GPU服务器配额的端口;资源划分层,用于将K8s集群中的GPU服务器划分给GPU应用;资源管理层,用于观察GPU应用对GPU服务器的使用情况,并进行动态调整。本发明可大幅提升GPU服务器的利用率;并且,以共享GPU调度的形式把GPU资源按需分配到获得授权的GPU应用,实现资源限额。
Patent Agency Ranking
0/0