Invention Publication
CN110245753A 一种基于幂指数量化的神经网络压缩方法
无效 - 驳回
- Patent Title: 一种基于幂指数量化的神经网络压缩方法
-
Application No.: CN201910445413.3Application Date: 2019-05-27
-
Publication No.: CN110245753APublication Date: 2019-09-17
- Inventor: 陆生礼 , 庞伟 , 刘昊 , 樊迎博 , 花硕硕 , 缪烨昊
- Applicant: 东南大学
- Applicant Address: 江苏省南京市玄武区四牌楼2号
- Assignee: 东南大学
- Current Assignee: 东南大学
- Current Assignee Address: 江苏省南京市玄武区四牌楼2号
- Agency: 南京经纬专利商标代理有限公司
- Agent 熊玉玮
- Main IPC: G06N3/08
- IPC: G06N3/08

Abstract:
本发明涉及人工智能神经网络技术领域,具体公开一种基于幂指数量化的神经网络压缩方法。该方法,在外部数据集上训练卷积神经网络后获取该网络的初始化权值参数;根据权值参数绝对值的大小以及分组阈值将权值参数分为两组,绝对值超过阈值的一组基于预先设定的位宽及绝对值最大的权值参数量化大于分组阈值的一组权值参数,将权值参数量化为2的幂或者0;对小于分组阈值的权值参数再训练后执行分组再量化的循环操作,直至网络收敛。本发明在保证参数的取值范围不被压缩的同时在一定程度上减小量化对最终目标检测准确率的影响,解决了量化后准确率下降过多以及硬件实现难度大的问题。
Information query