发明授权
- 专利标题: 一种实时迁移的动态GPU调度方法及系统
-
申请号: CN202311214279.9申请日: 2023-09-20
-
公开(公告)号: CN116954929B公开(公告)日: 2023-12-01
- 发明人: 王晓丹 , 王曦 , 王桾荷 , 颜鑫
- 申请人: 四川并济科技有限公司
- 申请人地址: 四川省内江市东兴区兰桂大道377号1单元10楼1号
- 专利权人: 四川并济科技有限公司
- 当前专利权人: 四川并济科技有限公司
- 当前专利权人地址: 四川省内江市东兴区兰桂大道377号1单元10楼1号
- 代理机构: 成都拓荒者知识产权代理有限公司
- 代理商 王坚敏
- 主分类号: G06F9/50
- IPC分类号: G06F9/50
摘要:
本发明涉及GPU动态调度技术领域,具体涉及一种实时迁移的动态GPU调度方法及系统。先实时获取GPU集群内每个GPU的内核占用率和显存占用率;并依据每个GPU的内核占用率和预设的内核负载阈值对GPU进行分类,获得GPU内核的负载状态。同时对GPU分类结果进行内核负载检索,得到GPU集群中的过载GPU和欠载GPU;将GPU集群中的GPU显存虚拟化为统一显存,并将每个GPU显存的指针映射至统一显存;最后依据目标迁移量,调用统一显存将过载GPU的模型参数所占用GPU显存的指针指向欠载GPU。本发明实现了GPU集群整体的动态负载均衡,缩短了生成式大模型训练的时间,提高了GPU集群的整体利用率。
公开/授权文献
- CN116954929A 一种实时迁移的动态GPU调度方法及系统 公开/授权日:2023-10-27