一种基于能耗预测的边端协同AI模型推理方法

    公开(公告)号:CN117331699A

    公开(公告)日:2024-01-02

    申请号:CN202311330737.5

    申请日:2023-10-13

    摘要: 本发明公开了一种基于能耗预测的边端协同AI模型推理方法,包括:将若干AI模型整合成AI统合模型;采集AI统合模型各类型层时延与能耗数据,形成时延与能耗数据集;构建AI统合模型各类型层时延与能耗预测模型;计算得到传输时延与能耗理论值;计算得到推理过程的总时延与总能耗;根据传输时延与能耗理论值、推理过程的总时延与总能耗,构建全局预测模型;根据全局预测模型预测全局时延与能耗;通过贪心算法找到最优分割点;执行推理,进行到最优分割点时,将推理数据和分割点索引传输给边缘服务器;边缘服务器继续推理,完成推理后将推理结果传输给终端,推理任务结束。本发明在保证时延的前提下将能耗作为优化目标,降低了应用AI模型所带来的能耗。