- 专利标题: 一种基于批处理动态调节的模型推理调度方法及系统
-
申请号: CN202211342691.4申请日: 2022-10-31
-
公开(公告)号: CN115408163A公开(公告)日: 2022-11-29
- 发明人: 张殷 , 王俊波 , 李国伟 , 唐琪 , 熊仕斌 , 蒋维 , 罗容波 , 范心明 , 李新 , 董镝 , 宋安琪 , 王智娇 , 刘少辉 , 吴焯军 , 刘昊 , 王云飞 , 李雷 , 涂琬婧 , 李兰茵 , 赖艳珊 , 陈绮琪 , 姜沛东
- 申请人: 广东电网有限责任公司佛山供电局
- 申请人地址: 广东省佛山市禅城区汾江南路1号
- 专利权人: 广东电网有限责任公司佛山供电局
- 当前专利权人: 广东电网有限责任公司佛山供电局
- 当前专利权人地址: 广东省佛山市禅城区汾江南路1号
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 任文生
- 主分类号: G06F9/50
- IPC分类号: G06F9/50 ; G06N3/04 ; G06N3/063 ; G06N3/08 ; G06N5/04
摘要:
本发明涉及大数据处理技术领域,公开了一种基于批处理动态调节的模型推理调度方法及系统,其方法通过对多个异构处理器进行性能测试,得到相应的处理性能,根据异构处理器的硬件状态和处理性能加和处理,得到相应的异构处理器的推理工作量,并确定推理工作量最小的异构处理器,通过推理调度器将预设的推理模型部署在推理工作量最小的异构处理器上,并且,异构处理器执行预设的推理模型的推理服务,对待处理数据进行批处理,从而使得部署的模型可以分配足够的资源完成推理工作,缓解处理器资源争用的问题,提高了模型推理效率。
公开/授权文献
- CN115408163B 一种基于批处理动态调节的模型推理调度方法及系统 公开/授权日:2023-03-24