- 专利标题: 基于模型蒸馏的异构算力调度方法、系统及可读存储介质
-
申请号: CN202410527700.X申请日: 2024-04-29
-
公开(公告)号: CN118093210A公开(公告)日: 2024-05-28
- 发明人: 陈晓莉 , 国毓芯 , 朱崇 , 赖慧绘 , 林建洪
- 申请人: 浙江鹏信信息科技股份有限公司
- 申请人地址: 浙江省杭州市余杭区仓前街道向往街1008号14幢9-10层
- 专利权人: 浙江鹏信信息科技股份有限公司
- 当前专利权人: 浙江鹏信信息科技股份有限公司
- 当前专利权人地址: 浙江省杭州市余杭区仓前街道向往街1008号14幢9-10层
- 代理机构: 浙江永鼎律师事务所
- 代理商 王日精
- 主分类号: G06F9/50
- IPC分类号: G06F9/50 ; G06F21/57 ; G06N20/00
摘要:
本发明涉及基于模型蒸馏的异构算力调度方法、系统及可读存储介质,其调度方法包括以下步骤:S1、采集算力资源请求;其中,算力资源请求的信息包括预训练模型及其计算框架、选择镜像、申请加速器类型、使用用途及目标资源池;S2、基于目标资源池的算力大小,判断算力资源请求所需的算力大小是否满足目标要求;若否,则转至步骤S3;若是,则转至步骤S4;S3、基于知识蒸馏对预训练模型进行模型压缩,基于压缩后的模型分配对应的算力资源;S4、调度分配对应的算力资源并进行安全校验,安全校验通过后进行下发。本发明通过模型能力迁移的方式,选择轻量级模型以达到模型压缩的目的,以聚合社会多方算力、满足算力消费方多样化业务需求。
公开/授权文献
- CN118093210B 基于模型蒸馏的异构算力调度方法、系统及可读存储介质 公开/授权日:2024-06-28