发明公开
CN115374935A 一种神经网络的剪枝方法
审中-实审
- 专利标题: 一种神经网络的剪枝方法
-
申请号: CN202211122342.1申请日: 2022-09-15
-
公开(公告)号: CN115374935A公开(公告)日: 2022-11-22
- 发明人: 朴星泉 , 汪成亮 , 汪鹏 , 吴昊 , 杨镡 , 黄哲通 , 任骜
- 申请人: 重庆大学 , 中国人民解放军陆军军医大学第一附属医院
- 申请人地址: 重庆市沙坪坝区沙正街174号;
- 专利权人: 重庆大学,中国人民解放军陆军军医大学第一附属医院
- 当前专利权人: 重庆大学,中国人民解放军陆军军医大学第一附属医院
- 当前专利权人地址: 重庆市沙坪坝区沙正街174号;
- 代理机构: 重庆天成卓越专利代理事务所
- 代理商 王宏松
- 主分类号: G06N3/08
- IPC分类号: G06N3/08 ; G06N3/063
摘要:
本发明提出了一种神经网络的剪枝方法,包括以下步骤:S1,根据硬件资源的规模、时序约束、以及先验知识,确定脉动阵列规模,再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模,确定最大筛选通道数和过滤器分组的最小数量;S2,将S1得到的最大筛选通道数和过滤器分组的最小数量以及其它约束条件训练神经网络;S3,训练完毕后,通过编译器产生指令,对加速器的剪枝模式进行配置;S4,然后加速器接收解码后的指令,将输入特征图数据、经过训练压缩后的权重数据、根据训练生成的剪枝模式配置信息、以及经过训练生成的通道选择数据加载至加速器内部的硬件缓存单元中;S5,数据全部加载至硬件内部资源后,加速器开始进行卷积计算,脉动阵列开始工作,最终得到卷积结果。本发明能够在满足脉动阵列SA工作模式,保证其工作效率的前提下,减少了模型的参数量,提高了模型推理的速度。
公开/授权文献
- CN115374935B 一种神经网络的剪枝方法 公开/授权日:2023-08-11