发明授权
- 专利标题: 模型量化方法、装置、电子设备及存储介质
-
申请号: CN202311552181.4申请日: 2023-11-21
-
公开(公告)号: CN117574966B公开(公告)日: 2024-10-25
- 发明人: 蒋力 , 刘方鑫 , 杨宁 , 宋芝妍 , 熊大鹏 , 李涛
- 申请人: 苏州亿铸智能科技有限公司 , 上海交通大学
- 申请人地址: 江苏省苏州市高新区塔园路101号佳兆业悦峰大厦1幢1911室;
- 专利权人: 苏州亿铸智能科技有限公司,上海交通大学
- 当前专利权人: 苏州亿铸智能科技有限公司,上海交通大学
- 当前专利权人地址: 江苏省苏州市高新区塔园路101号佳兆业悦峰大厦1幢1911室;
- 主分类号: G06N3/0464
- IPC分类号: G06N3/0464 ; G06N3/08 ; G06N5/04
摘要:
本申请公开一种模型量化方法,包括:获取当前网络层的权重矩阵,对权重矩阵进行划块得到多个权重块;对多个权重块内的权重绝对值按列排序重组得到多个目标权重块;根据每个目标权重块的量化偏差和量化阈值确定每个目标权重块的量化精度;根据多个目标权重块在量化前后的权重分布偏差和分布阈值对量化阈值进行调节以获取多个目标权重块的目标量化精度;根据多个目标权重块的目标量化精度对多个目标权重块进行量化得到多个量化权重块;采用按位交错的映射方式将多个量化权重块映射到多个交叉阵列单元上。本申请还提供一种模型量化装置、电子设备及存储介质,可以灵活选择权重的位宽,在保证压缩效率的同时减少精度损失。