一种CNN卷积层硬件结构及加速器
摘要:
本发明公开了一种CNN卷积层硬件结构及加速器,本发明采用可以并行计算的排列成n行m列的双卷积处理单元,同一列的双卷积处理单元共享从同一个特征图RAM获取的特征图,同一行的双卷积处理单元共享从索引权重RAM获取的卷积核权重,可以有效减少中间输出,同时本发明的数据重组单元对多个数据进行累加后仅需要对RAM进行一次写操作,减少了访问次数。
公开/授权文献
0/0