一种基于脉动阵列的神经网络加速器卷积计算装置与方法
摘要:
本发明公开了一种基于脉动阵列的神经网络加速器卷积计算装置与方法,该装置的结构由64×64个同构的PE单元构成,组成脉动阵列的形式,包括多个权重输入通道,数据输入通道以及相应的数据(权重)选通有效信号。脉动阵列首行使能开始后,使能信号开始有效,所有数据计算完毕后,使能信号关闭。脉动阵列中权重数据由上往下传递,每个PE单元的计算结果和权重有效信号经过一级寄存器后输入到同一列的下一个PE单元中参与计算。脉动阵列中特征图数据和数据有效信号从左往右传递,经过一级寄存器后输入到一行的下一个PE单元中参与计算。
0/0