一种适合FPGA的神经网络量化方法及装置

    公开(公告)号:CN115860062A

    公开(公告)日:2023-03-28

    申请号:CN202211456706.X

    申请日:2022-11-21

    申请人: 上海大学

    摘要: 本发明公开了一种适合FPGA的神经网络量化方法及装置。该方法包括以下步骤:在前向传播过程中,对神经网络模型中每层网络的权重参数进行第一次移位量化;根据权重参数的第一次移位量化的量化误差对这些参数进行分组处理,得到量化后的权重参数值;根据量化后的权重参数值计算每一层的卷积结果;在反向传播过程中更新超参数,直到训练达到预定的精度或者Epoch。该装置包括量化模块,权重分组模块和重训练模块。本发明将乘法运算转化为移位运算,降低了在FPGA等硬件设备上的计算成本和部署难度,有效提高了量化精度,增加了权重表示的灵活性。