网络模型压缩方法、装置、设备和可读存储介质

    公开(公告)号:CN116090540A

    公开(公告)日:2023-05-09

    申请号:CN202211693995.5

    申请日:2022-12-28

    Abstract: 本申请公开了一种网络模型压缩方法、装置、设备和可读存储介质,该方法包括:获取待压缩的网络模型中每个卷积层的权重;在N个网络模型中,分别对第n个网络模型第n层目标卷积层进行预设模型压缩处理,生成N个第一候选网络模型;获取网络模型对预设图像数据的第一识别数据与每个第一候选压缩模型对预设图像数据的第二识别数据之间的余弦相似度信息;根据余弦相似度信息,确定目标压缩网络模型。根据本申请实施例,能够在不需要对原始训练数据进行微调的情况下,对由大量卷积神经网络组成的视觉算法模型进行压缩,并且精度损失非常小。

Patent Agency Ranking