一种基于云边端协同的深度学习模型推理加速方法

发明授权

CN115034390B 一种基于云边端协同的深度学习模型推理加速方法有权

请登陆查看更多内容

专利标题： 一种基于云边端协同的深度学习模型推理加速方法
申请号： CN202210961978.9

申请日： 2022-08-11
公开(公告)号： CN115034390B

公开(公告)日： 2022-11-18
发明人: 郭永安 , 周金粮 , 王宇翱 , 钱琪杰 , 孙洪波
申请人： 南京邮电大学
申请人地址： 江苏省南京市鼓楼区新模范马路66号
专利权人： 南京邮电大学
当前专利权人： 南京邮电大学
当前专利权人地址： 江苏省南京市鼓楼区新模范马路66号
代理机构： 南京经纬专利商标代理有限公司
代理商 朱小兵
主分类号： G06N3/08
IPC分类号： G06N3/08 ; G06N3/04 ; G06F9/50 ; H04L67/10

摘要：

本发明公开了一种基于云边端协同的深度学习模型推理加速方法，具体涉及一种深度学习模型分层卸载方法。该方法通过对整个深度学习模型推理过程中的计算时延、数据传输时延、数据传播时延和模型分层卸载策略生成时延进行理论建模，并以计算任务响应时延最小为优化目标，决定最优深度学习模型的分层卸载策略。相较于以物理端为主导和以云计算中心为主导的深度学习模型执行框架，本方法通过将边缘计算范式和云计算结合起来，并将深度学习模型分层卸载至不同的边缘计算节点，在满足计算精度的前提下，实现计算任务响应时延最小化。

公开/授权文献

CN115034390A 一种基于云边端协同的深度学习模型推理加速方法公开/授权日：2022-09-09

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N3/00	基于生物学模型的计算机系统
G06N3/02	.采用神经网络模型
G06N3/08	..学习方法