一种基于幂指数量化的神经网络压缩方法

Invention Publication

CN110245753A 一种基于幂指数量化的神经网络压缩方法无效 - 驳回

Please log in to see more content

Patent Title: 一种基于幂指数量化的神经网络压缩方法
Application No.: CN201910445413.3

Application Date: 2019-05-27
Publication No.: CN110245753A

Publication Date: 2019-09-17
Inventor: 陆生礼 , 庞伟 , 刘昊 , 樊迎博 , 花硕硕 , 缪烨昊
Applicant: 东南大学
Applicant Address: 江苏省南京市玄武区四牌楼2号
Assignee: 东南大学
Current Assignee: 东南大学
Current Assignee Address: 江苏省南京市玄武区四牌楼2号
Agency: 南京经纬专利商标代理有限公司
Agent 熊玉玮
Main IPC: G06N3/08
IPC: G06N3/08

Abstract:

本发明涉及人工智能神经网络技术领域，具体公开一种基于幂指数量化的神经网络压缩方法。该方法，在外部数据集上训练卷积神经网络后获取该网络的初始化权值参数；根据权值参数绝对值的大小以及分组阈值将权值参数分为两组，绝对值超过阈值的一组基于预先设定的位宽及绝对值最大的权值参数量化大于分组阈值的一组权值参数，将权值参数量化为2的幂或者0；对小于分组阈值的权值参数再训练后执行分组再量化的循环操作，直至网络收敛。本发明在保证参数的取值范围不被压缩的同时在一定程度上减小量化对最终目标检测准确率的影响，解决了量化后准确率下降过多以及硬件实现难度大的问题。

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N3/00	基于生物学模型的计算机系统
G06N3/02	.采用神经网络模型
G06N3/08	..学习方法