一种神经网络的剪枝方法

发明公开

请登陆查看更多内容

专利标题： 一种神经网络的剪枝方法
申请号： CN202211122342.1

申请日： 2022-09-15
公开(公告)号： CN115374935A

公开(公告)日： 2022-11-22
发明人: 朴星泉 , 汪成亮 , 汪鹏 , 吴昊 , 杨镡 , 黄哲通 , 任骜
申请人： 重庆大学 , 中国人民解放军陆军军医大学第一附属医院
申请人地址： 重庆市沙坪坝区沙正街174号;
专利权人： 重庆大学,中国人民解放军陆军军医大学第一附属医院
当前专利权人： 重庆大学,中国人民解放军陆军军医大学第一附属医院
当前专利权人地址： 重庆市沙坪坝区沙正街174号;
代理机构： 重庆天成卓越专利代理事务所
代理商 王宏松
主分类号： G06N3/08
IPC分类号： G06N3/08 ; G06N3/063

摘要：

本发明提出了一种神经网络的剪枝方法，包括以下步骤：S1，根据硬件资源的规模、时序约束、以及先验知识，确定脉动阵列规模，再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模，确定最大筛选通道数和过滤器分组的最小数量；S2，将S1得到的最大筛选通道数和过滤器分组的最小数量以及其它约束条件训练神经网络；S3，训练完毕后，通过编译器产生指令，对加速器的剪枝模式进行配置；S4，然后加速器接收解码后的指令，将输入特征图数据、经过训练压缩后的权重数据、根据训练生成的剪枝模式配置信息、以及经过训练生成的通道选择数据加载至加速器内部的硬件缓存单元中；S5，数据全部加载至硬件内部资源后，加速器开始进行卷积计算，脉动阵列开始工作，最终得到卷积结果。本发明能够在满足脉动阵列SA工作模式，保证其工作效率的前提下，减少了模型的参数量，提高了模型推理的速度。

公开/授权文献

CN115374935B 一种神经网络的剪枝方法公开/授权日：2023-08-11

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N3/00	基于生物学模型的计算机系统
G06N3/02	.采用神经网络模型
G06N3/08	..学习方法