发明公开
- 专利标题: 一种跨范围量化的卷积神经网络压缩方法
-
申请号: CN202210260332.8申请日: 2022-03-16
-
公开(公告)号: CN114970853A公开(公告)日: 2022-08-30
- 发明人: 邢晓芬 , 杨弈才 , 郭锴凌 , 徐向民
- 申请人: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
- 申请人地址: 广东省广州市天河区五山路381号;
- 专利权人: 华南理工大学,中山市华南理工大学现代产业技术研究院
- 当前专利权人: 华南理工大学,中山市华南理工大学现代产业技术研究院
- 当前专利权人地址: 广东省广州市天河区五山路381号;
- 代理机构: 广州粤高专利商标代理有限公司
- 代理商 周春丽
- 主分类号: G06N3/08
- IPC分类号: G06N3/08 ; G06N3/04
摘要:
本发明公开了一种跨范围量化的卷积神经网络压缩方法,包括以下步骤:确定量化卷积神经网络的量化比特和该量化比特下的量化范围,以及基于步长量化的量化函数;训练一个全精度卷积神经网络,并使用全精度卷积神经网络初始化量化卷积神经网络以及量化步长;前向传播阶段,对卷积神经网络的权重参数以及激活值进行量化,对于量化阈值范围内的值,采取常规量化方式;对于量化阈值范围外的值,先减去量化阈值,再进行常规量化;反向传播阶段,使用梯度近似让不可导的量化函数变为可导。本发明在常规量化的基础上对量化范围外的值采取了不同的量化方式,在保留图像识别精度的同时,实现了卷积神经网络的压缩和加速。
公开/授权文献
- CN114970853B 一种跨范围量化的卷积神经网络压缩方法 公开/授权日:2024-09-06