Invention Grant
- Patent Title: 一种混合精度量化方法、装置、介质及设备
-
Application No.: CN202411153835.0Application Date: 2024-08-21
-
Publication No.: CN118673959BPublication Date: 2024-10-22
- Inventor: 袁勇 , 施航 , 任祖杰 , 缪锐 , 朱琦 , 孙沁璇 , 刘洋 , 彭风光 , 庞心健
- Applicant: 之江实验室
- Applicant Address: 浙江省杭州市余杭区中泰街道科创大道之江实验室
- Assignee: 之江实验室
- Current Assignee: 之江实验室
- Current Assignee Address: 浙江省杭州市余杭区中泰街道科创大道之江实验室
- Agency: 北京博思佳知识产权代理有限公司
- Agent 邓超
- Main IPC: G06N3/04
- IPC: G06N3/04 ; G06N3/086 ; G06V10/764 ; G06V10/82
Abstract:
在本说明书提供一种混合精度量化方法、装置、介质及设备,通过确定深度神经网络模型中的各层的量化位宽,对深度神经网络模型进行量化,确定候选量化模型,并将样本分别输入深度神经网络模型以及候选量化模型,确定候选量化模型的量化误差、加速比以及压缩效果,进而确定候选量化模型的适应度,最后,根据预设的进化算法以及候选量化模型的适应度,确定深度神经网络模型的目标量化模型,使得混合精度量化方法能够根据少量无标签样本确定深度神经网络模型的目标量化模型,提高了混合精度量化方法的泛用性。
Public/Granted literature
- CN118673959A 一种混合精度量化方法、装置、介质及设备 Public/Granted day:2024-09-20
Information query