一种强化学习自动感知权重分布的卷积神经网络量化方法

    公开(公告)号:CN112733964B

    公开(公告)日:2024-01-19

    申请号:CN202110134308.5

    申请日:2021-02-01

    摘要: 公开了一种强化学习自动感知权重分布的卷积神经网络量化方法,方法中,将每层批处理操作的参数与卷积操作的权重融合得到融合后的权重和偏置,获取浮点卷积神经网络模型中每一层融合后的权重的分布信息;根据每层权重的分布信息强化学习自动搜索最优的每层权重缩放系数,基于每层权重缩放系数将浮点权重量化成INT8类型数据;输入校准数据集,每输入一组数据记录每层输出特征图,选取众数作为每层输出特征图的缩放系数,根据每层权重的缩放系数和每层输出特征图的缩放系数计算得到每层偏置的缩放系数以将浮点的偏置量化为INT32类型的偏置,基于INT8类型数据、INT32类型的偏置和总的缩放系数构建前向推理过程完成量化。

    一种强化学习自动感知权重分布的卷积神经网络量化方法

    公开(公告)号:CN112733964A

    公开(公告)日:2021-04-30

    申请号:CN202110134308.5

    申请日:2021-02-01

    摘要: 公开了一种强化学习自动感知权重分布的卷积神经网络量化方法,方法中,将每层批处理操作的参数与卷积操作的权重融合得到融合后的权重和偏置,获取浮点卷积神经网络模型中每一层融合后的权重的分布信息;根据每层权重的分布信息强化学习自动搜索最优的每层权重缩放系数,基于每层权重缩放系数将浮点权重量化成INT8类型数据;输入校准数据集,每输入一组数据记录每层输出特征图,选取众数作为每层输出特征图的缩放系数,根据每层权重的缩放系数和每层输出特征图的缩放系数计算得到每层偏置的缩放系数以将浮点的偏置量化为INT32类型的偏置,基于INT8类型数据、INT32类型的偏置和总的缩放系数构建前向推理过程完成量化。