-
公开(公告)号:CN118485128A
公开(公告)日:2024-08-13
申请号:CN202410600483.2
申请日:2024-05-15
申请人: 东南大学 , 东南大学—无锡集成电路技术研究所
IPC分类号: G06N3/084 , G06N3/063 , G06N3/0464
摘要: 本发明公开了一种面向边缘端异构设备部署深度卷积神经网络在线学习的计算图优化方法,包括以下步骤:S100:提取目标算法的前传和反传静态计算图;S200:针对前传和反传计算图进行计算图优化。反向传播计算图优化范式包括:反传计算图BN层融合、反传算子的计算重构、激活函数反传算子融合、轻量算子重计算等优化方式;S300:考虑边缘异构设备有限的全局内存,进行内存占用优化:根据优化器的种类以及张量的生命周期,进行张量的in‑place更新,并调整算子的执行顺序,复用相应的张量内存空间。本发明通过优化前反传的计算图,有效优化了计算与访存效率,提高深度卷积神经网络在线学习在端侧设备的部署效率。