发明授权
- 专利标题: 一种基于面积折叠的神经网络推理加速方法
-
申请号: CN202310736462.9申请日: 2023-06-20
-
公开(公告)号: CN116737382B公开(公告)日: 2024-01-02
- 发明人: 魏祥麟 , 王斌 , 范建华 , 胡永扬 , 王彦刚 , 于龙
- 申请人: 中国人民解放军国防科技大学
- 申请人地址: 江苏省南京市秦淮区后标营路18号
- 专利权人: 中国人民解放军国防科技大学
- 当前专利权人: 中国人民解放军国防科技大学
- 当前专利权人地址: 江苏省南京市秦淮区后标营路18号
- 代理机构: 河北冀华知识产权代理有限公司
- 代理商 王占华
- 主分类号: G06F9/50
- IPC分类号: G06F9/50 ; G06N3/04 ; G06N5/04
摘要:
本发明公开了一种基于面积折叠的神经网络推理加速方法,涉及人工智能技术领域。所述方法包括如下步骤:算子生成:加载待加速的深度神经网络模型,分析该模型的组成结构,根据该模型组成结构生成模型顶层算子与各网络层算子;面积折叠:将FPGA中的存储资源与计算资源分别建模为矩阵面积的横轴与纵轴,并以此对顶层算子与各网络层算子的资源占用进行评估;方案获取:根据分配到的面积确定各网络层算子的折叠尺寸,确定各网络层算子的输入通道数与输出通道数。所述方法可以很好地降低在FPGA上加速神经网络的开发难度,并更好的适应多种不同的开发条件,显著降低开发过程的复杂程度。
公开/授权文献
- CN116737382A 一种基于面积折叠的神经网络推理加速方法 公开/授权日:2023-09-12