基于模型蒸馏的异构算力调度方法、系统及可读存储介质
摘要:
本发明涉及基于模型蒸馏的异构算力调度方法、系统及可读存储介质,其调度方法包括以下步骤:S1、采集算力资源请求;其中,算力资源请求的信息包括预训练模型及其计算框架、选择镜像、申请加速器类型、使用用途及目标资源池;S2、基于目标资源池的算力大小,判断算力资源请求所需的算力大小是否满足目标要求;若否,则转至步骤S3;若是,则转至步骤S4;S3、基于知识蒸馏对预训练模型进行模型压缩,基于压缩后的模型分配对应的算力资源;S4、调度分配对应的算力资源并进行安全校验,安全校验通过后进行下发。本发明通过模型能力迁移的方式,选择轻量级模型以达到模型压缩的目的,以聚合社会多方算力、满足算力消费方多样化业务需求。
0/0