一种稀疏神经网络加速器及其实现方法
摘要:
本发明提供一种稀疏神经网络加速器及实现方法,加速器主要包括PE阵列、输出存储器和调度器模块,PE阵列被划分为多个PE组,每个PE组和对应的输出存储器组成一个关联组,关联组中PE的数量和输出存储器的数量相等;关联组中的每一个PE单元可访问关联组中的任一输出存储器;任一关联组中的PE单元,根据输入的激活值和权重值计算得到多个输出结果,并按预设规则写入对应多个输出存储器中;调度器模块调度输出激活值的顺序,降低哈希冲突的概率。本发明将原始PE阵列划分为多个PE组,与对应输出存储器形成关联组体系架构,大大降低输出内存的面积并降低功耗开销;调度器模块降低了哈希冲突的概率,极大提升了整个系统的计算性能。
公开/授权文献
0/0