一种实现CNN卷积层的装置及加速器
Abstract:
本发明公开了一种实现CNN卷积层的装置及加速器,本发明采用可以并行计算的排列成n行m列的双卷积处理单元,同一列的双卷积处理单元共享从同一个特征图RAM获取的特征图,同一行的双卷积处理单元共享从索引权重RAM获取的卷积核权重,可以有效减少中间输出,同时本发明的数据重组单元对多个数据进行累加后仅需要对RAM进行一次写操作,减少了访问次数。
Public/Granted literature
Patent Agency Ranking
0/0