Invention Publication
- Patent Title: 神经网络模型的量化方法和量化神经网络模型的装置
-
Application No.: CN202410056812.1Application Date: 2024-01-15
-
Publication No.: CN118133904APublication Date: 2024-06-04
- Inventor: 魏鹏辉 , 孙刚 , 贺国强 , 张准祐
- Applicant: 三星(中国)半导体有限公司 , 三星电子株式会社
- Applicant Address: 陕西省西安市高新区洨河北路1999号;
- Assignee: 三星(中国)半导体有限公司,三星电子株式会社
- Current Assignee: 三星(中国)半导体有限公司,三星电子株式会社
- Current Assignee Address: 陕西省西安市高新区洨河北路1999号;
- Agency: 北京铭硕知识产权代理有限公司
- Agent 方成; 张川绪
- Main IPC: G06N3/0495
- IPC: G06N3/0495 ; G06N3/0985

Abstract:
提供一种神经网络模型的量化方法和量化神经网络模型的装置。所述量化方法包括:针对神经网络模型中的多个层中的一个或多个层,确定与所述一个或多个层的用于量化的多个最大权重误差分别对应的多个敏感度,其中,所述多个最大权重误差针对神经网络模型被预先配置;基于所述多个敏感度,确定所述多个最大权重误差之中的用于所述一个或多个层的最大权重误差;以及基于用于所述一个或多个层的最大权重误差,将所述一个或多个层的第一数据类型的权重量化为第二数据类型的权重。
Information query