一种用于图像分类模型训练的自蒸馏训练方法

    公开(公告)号:CN115512156A

    公开(公告)日:2022-12-23

    申请号:CN202211173732.1

    申请日:2022-09-26

    摘要: 本发明提出的是一种用于图像分类模型训练的自蒸馏训练方法,该方法包括:1、针对图像分类模型完成自蒸馏框架的搭建;2、将深层分类器划分出四个模块:在第一个模块的基础上依次增加第一注意力模块、第一浅层模块、第一全连接层作为第一浅层分类器;在第一个模块与第二个模块的基础上依次增加第二注意力模块、第二浅层模块、第二全连接层作为第二浅层分类器;在第一个模块、第二个模块、第三个模块的基础上依次增加第三注意力模块、第三浅层模块、第三全连接层作为第三浅层分类器;在第一浅层模块的基础上增加第四全连接层,在第二浅层模块的基础上增加第五全连接层;3、使用数据集来进行自蒸馏训练,得到一个深层分类器和三个浅层分类器。

    轻量化的残差神经网络模型
    4.
    发明公开

    公开(公告)号:CN115131579A

    公开(公告)日:2022-09-30

    申请号:CN202210873747.2

    申请日:2022-07-24

    摘要: 本发明提供了一种轻量化的残差神经网络模型,包括:输入模块,用于对输入特征图进行预处理以得到中间特征图;特征提取模块,与输入模块连接,用于将中间特征图转换为特征提取图;其中,特征提取模块包括依次连接的多个残差块,通过设置多个残差块中的每一个残差块的主分支上的各卷积层及对应的卷积方式和/或多个残差块的每一个残差块的捷径分支上的卷积层及卷积方式,以使中间特征图在转换为特征提取图时降低卷积过程中的参数量;及输出模块,与特征提取模块连接,用于对特征提取图进行处理以得到输出特征图。本申请的轻量化的残差神经网络模型既能降低参数总量,经过自蒸馏训练后又能保持与原残差神经网络相近的性能,可应用融合、重建等领域。

    一种基于VGG11(BN)神经网络蒸馏训练方案

    公开(公告)号:CN118966286A

    公开(公告)日:2024-11-15

    申请号:CN202411058928.5

    申请日:2024-08-02

    IPC分类号: G06N3/0464 G06N3/096

    摘要: 本发明属于神经网络技术领域,尤其是一种基于VGG11(BN)神经网络蒸馏训练方案,针对现有的现有训练方式下VGG11(BN)神经网络精度受网络结构限制的问题,现提出如下方案,其采用离线和在线两种知识蒸馏训练的方式,即首先对一个VGG11(BN)网络进行普通训练,训练完成之后,将其作为教师网络开始指导自蒸馏框架进行蒸馏训练;基于VGG11(BN)网络搭建蒸馏训练方案,由教师网络和自蒸馏框架两部分组成,以VGG11(BN)神经网络为基础,额外引入模块结构构建多个分类器搭建自蒸馏框架,然后使用在同一任务下已完成普通训练的VGG11(BN)网络来指导整个自蒸馏框架的训练,通过蒸馏的方式提升VGG11(BN)网络精度,进一步提升蒸馏效果,解决现有训练方式下VGG11(BN)神经网络精度受网络结构限制的问题。