基于并行复用的卷积神经网络的硬件加速器及并行复用方法
摘要:
本发明公开了一种基于并行复用的卷积神经网络的硬件加速器及并行复用方法,该硬件加速器包括:参数存储模块、REG‑FIFO模块、计数控制模块、输入复用的卷积运算模块、激活模块、池化层模块;其中,参数存储模块负责预存图片参数和练后的权值参数;REG‑FIFO模块负责生成与卷积核相匹配的输入矩阵以及读取矩阵数据;计数控制模块负责时钟周期计数并依此控制REG‑FIFO模块的输入输出;输入复用的卷积运算模块负责卷积层与全连接层的卷积运算;激活模块负责卷积层和全连接层的输出激活操作;池化层模块负责经激活后的卷积层输出的池化操作。本发明旨在实现高运算并行度、高度数据复用、低硬件复杂度的卷积神经网络计算。
0/0