一种神经网络的剪枝方法

    公开(公告)号:CN115374935B

    公开(公告)日:2023-08-11

    申请号:CN202211122342.1

    申请日:2022-09-15

    IPC分类号: G06N3/082 G06N3/063

    摘要: 本发明提出了一种神经网络的剪枝方法,包括以下步骤:S1,根据硬件资源的规模、时序约束、以及先验知识,确定脉动阵列规模,再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模,确定最大筛选通道数和过滤器分组的最小数量;S2,将S1得到的最大筛选通道数和过滤器分组的最小数量以及其它约束条件训练神经网络;S3,训练完毕后,通过编译器产生指令,对加速器的剪枝模式进行配置;S4,然后加速器接收解码后的指令,将输入特征图数据、经过训练压缩后的权重数据、根据训练生成的剪枝模式配置信息、以及经过训练生成的通道选择数据加载至加速器内部的硬件缓存单元中;S5,数据全部加载至硬件内部资源后,加速器开始进行卷积计算,脉动阵列开始工作,最终得到卷积结果。本发明能够在满足脉动阵列SA工作模式,保证其工作效率的前提下,减少了模型的参数量,提高了模型推理的速度。

    一种神经网络的剪枝方法
    2.
    发明公开

    公开(公告)号:CN115374935A

    公开(公告)日:2022-11-22

    申请号:CN202211122342.1

    申请日:2022-09-15

    IPC分类号: G06N3/08 G06N3/063

    摘要: 本发明提出了一种神经网络的剪枝方法,包括以下步骤:S1,根据硬件资源的规模、时序约束、以及先验知识,确定脉动阵列规模,再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模,确定最大筛选通道数和过滤器分组的最小数量;S2,将S1得到的最大筛选通道数和过滤器分组的最小数量以及其它约束条件训练神经网络;S3,训练完毕后,通过编译器产生指令,对加速器的剪枝模式进行配置;S4,然后加速器接收解码后的指令,将输入特征图数据、经过训练压缩后的权重数据、根据训练生成的剪枝模式配置信息、以及经过训练生成的通道选择数据加载至加速器内部的硬件缓存单元中;S5,数据全部加载至硬件内部资源后,加速器开始进行卷积计算,脉动阵列开始工作,最终得到卷积结果。本发明能够在满足脉动阵列SA工作模式,保证其工作效率的前提下,减少了模型的参数量,提高了模型推理的速度。

    一种可重构的稀疏神经网络加速器

    公开(公告)号:CN115169553A

    公开(公告)日:2022-10-11

    申请号:CN202210801703.9

    申请日:2022-07-07

    申请人: 重庆大学

    IPC分类号: G06N3/08 G06N3/04

    摘要: 本发明提出了一种可重构的稀疏神经网络加速器,其特征在于,包括:输入特征图存储模块、指令存储模块、权重存储模块、偏置存储模块、输出特征图存储模块、特征图Bitmap存储模块、控制模块、计算控制模块、地址映射模块、PE阵列模块和PU通用数据处理模块。控制模块与输入特征图存储模块、指令存储模块、权重存储模块、偏置存储模块、特征图Bitmap存储模块相连接;计算控制模块与输入特征图存储模块、指令存储模块、权重存储模块、偏置存储模块、输出特征图存储模块、特征图Bitmap存储模块、PE阵列运算模块相连接;地址映射模块与输入特征图存储模块、特征图Bitmap存储模块、输出特征图存储模块相连接,PE阵列运算模块与输入特征图存储模块、输出特征图存储模块、权重存储模块和偏置存储模块相连接;PU通用数据处理模块与指令存储模块、输出特征图存储模块、DDR模块相连接。本发明能够使用较少的资源同时支持多种卷积计算以提升神经网络加速器的通用性。

    一种卷积神经网络的加速方法及卷积神经网络加速器

    公开(公告)号:CN114662684A

    公开(公告)日:2022-06-24

    申请号:CN202210333277.0

    申请日:2022-03-31

    申请人: 重庆大学

    摘要: 本发明公开了一种卷积神经网络的加速方法及卷积神经网络加速器,包括根据输入特征图数据的地址信息,将从片外存储器中读取到的输入特征图数据暂存至片上存储器的缓存区;在将读取到的输入特征图数据暂存至缓存区的过程中,获取当前暂存的输入特征图数据位于缓存区内的位置;当判断到位置位于预先确定的规定位置,对缓存区进行滑窗处理;在进行滑窗处理时,将滑窗内的所有输入特征图数据拼接成一个待填充输入数据,并将待填充输入数据的剩余通道进行填充处理,得到一个输入数据;利用预先读取到的权重数据,对输入数据进行乘累加运算,得到卷积计算结果。本发明实施例能够提高PE运算阵列进行乘累加运算的资源利用率,进而缩短运算时间。