一种卷积神经网络推理硬件加速方法及其装置
摘要:
本发明公开了一种卷积神经网络推理硬件加速方法及其装置,方法为控制模块将残差变换信息发送给通路选择模块,通路选择模块将特征图数据送入维度变换模块和/或通路缓冲模块;通路缓冲模块暂存输入特征图数据;维度变换模块根据控制模块给出的变换通道数对输入特征图数据进行通道数变换;纵深卷积模块对原始卷积进行加速优化,减少卷积和参数及计算量;通路缓冲模块将暂存的输入特征图数据发送至残差计算模块;卷积结果经过维度变换模块送入残差计算模块;残差计算模块将来自通路缓冲模块和维度变换模块的两组特征图数据进行同维度求和计算;完成卷积加速流程。本发明和现有技术相比使得神经网络在移动端推理时能得到更大程度的加速效果。
公开/授权文献
0/0