一种基于面积折叠的神经网络推理加速方法
摘要:
本发明公开了一种基于面积折叠的神经网络推理加速方法,涉及人工智能技术领域。所述方法包括如下步骤:算子生成:加载待加速的深度神经网络模型,分析该模型的组成结构,根据该模型组成结构生成模型顶层算子与各网络层算子;面积折叠:将FPGA中的存储资源与计算资源分别建模为矩阵面积的横轴与纵轴,并以此对顶层算子与各网络层算子的资源占用进行评估;方案获取:根据分配到的面积确定各网络层算子的折叠尺寸,确定各网络层算子的输入通道数与输出通道数。所述方法可以很好地降低在FPGA上加速神经网络的开发难度,并更好的适应多种不同的开发条件,显著降低开发过程的复杂程度。
公开/授权文献
0/0