一种基于卷积神经网络的电网设备分类方法

    公开(公告)号:CN106897739A

    公开(公告)日:2017-06-27

    申请号:CN201710079894.1

    申请日:2017-02-15

    IPC分类号: G06K9/62 G06N3/02

    摘要: 本发明公开了一种基于卷积神经网络的电网设备分类方法,步骤1,根据已有的电网设备图像训练集和测试集,训练卷积神经网络模型;输入层对输入的图像数据进行预处理,用以增大数据量;卷积层的数量不大于N,N+1为常用卷积神经网络卷积层的层数;步骤2,利用训练完成的卷积神经网络模型对需分类的电网设备图像进行分类。本发明利用数据增强技术将输入图像数据进行预处理,增大数据量,解决了数据量不足会导致网络过拟合,精度下降的问题;鉴于训练数据的数量较少,削减了卷积层数量和卷积核数目,同时增大卷积核的尺寸,减小了每层卷积层所提取出的特征图的大小,从而减少了卷积层提取出的特征数量,同样起到了防止过拟合的作用,提高了精度。

    一种基于卷积神经网络的电网设备分类方法

    公开(公告)号:CN106897739B

    公开(公告)日:2019-10-22

    申请号:CN201710079894.1

    申请日:2017-02-15

    IPC分类号: G06K9/62 G06N3/02

    摘要: 本发明公开了一种基于卷积神经网络的电网设备分类方法,步骤1,根据已有的电网设备图像训练集和测试集,训练卷积神经网络模型;输入层对输入的图像数据进行预处理,用以增大数据量;卷积层的数量不大于N,N+1为常用卷积神经网络卷积层的层数;步骤2,利用训练完成的卷积神经网络模型对需分类的电网设备图像进行分类。本发明利用数据增强技术将输入图像数据进行预处理,增大数据量,解决了数据量不足会导致网络过拟合,精度下降的问题;鉴于训练数据的数量较少,削减了卷积层数量和卷积核数目,同时增大卷积核的尺寸,减小了每层卷积层所提取出的特征图的大小,从而减少了卷积层提取出的特征数量,同样起到了防止过拟合的作用,提高了精度。

    基于深度神经网络的视频压缩方法

    公开(公告)号:CN107396124A

    公开(公告)日:2017-11-24

    申请号:CN201710758241.6

    申请日:2017-08-29

    申请人: 南京大学

    发明人: 马展 陈彤 刘浩杰

    摘要: 本发明公开了一种基于深度神经网络的视频压缩方法,步骤如下:收集并整理视频图像数据集,构建神经网络训练集、测试集和交叉验证集;建立多层的深度神经网络;对于帧间预测,利用运动估计算法寻找最佳匹配块,并计算残差和帧间预测的均方差;预测完成后将残差作为新的训练数据训练残差编码网络,残差网络模型包括帧内残差和帧间残差;预测和残差神经网络的输出数据经过量化和无损熵编码一起作为固定长度码流的压缩数据;解码端通过与编码端对称的神经网络将压缩数据还原,并重建恢复出压缩后图像。本发明的视频压缩方法,与传统H.264视频编码方法在大量测试视频序列上的同等比较中,可以在相同质量上平均节省26%左右的码率。

    一种基于目标编码的端到端图像压缩方法

    公开(公告)号:CN111147862A

    公开(公告)日:2020-05-12

    申请号:CN202010003469.6

    申请日:2020-01-03

    申请人: 南京大学

    发明人: 马展 夏琪 刘浩杰

    摘要: 本发明公开了一种基于目标编码的图像压缩方法,步骤如下:(1)获得输入图像的语义分割结果;(2)将语义分割结果转化为几组二值化矩阵,分别对应为图像中各个目标和背景区域的掩膜;(3)将图像输入若干个编码器,得到若干个不同码率的特征图;(4)将各掩膜与相应码率的特征图相乘,得到各特定区域的特征图;(5)将各特征图量化;(6)分别计算各量化特征图的信息熵;(7)将所有量化特征图相加得到整幅图像的完整特征图;(8)对特征图进行熵编码和熵解码;(9)将图像特征图输入解码器,得到重建图像;(10)构建损失函数,利用优化器训练图像压缩网络,得到对应于某一码率的最优模型。利用本方法对图像进行压缩,能够有效提升在极低码率情况下重建图像的主观质量。

    一种基于目标编码的端到端图像压缩方法

    公开(公告)号:CN111147862B

    公开(公告)日:2021-02-23

    申请号:CN202010003469.6

    申请日:2020-01-03

    申请人: 南京大学

    发明人: 马展 夏琪 刘浩杰

    摘要: 本发明公开了一种基于目标编码的图像压缩方法,步骤如下:(1)获得输入图像的语义分割结果;(2)将语义分割结果转化为几组二值化矩阵,分别对应为图像中各个目标和背景区域的掩膜;(3)将图像输入若干个编码器,得到若干个不同码率的特征图;(4)将各掩膜与相应码率的特征图相乘,得到各特定区域的特征图;(5)将各特征图量化;(6)分别计算各量化特征图的信息熵;(7)将所有量化特征图相加得到整幅图像的完整特征图;(8)对特征图进行熵编码和熵解码;(9)将图像特征图输入解码器,得到重建图像;(10)构建损失函数,利用优化器训练图像压缩网络,得到对应于某一码率的最优模型。利用本方法对图像进行压缩,能够有效提升在极低码率情况下重建图像的主观质量。

    基于深度神经网络的视频压缩方法

    公开(公告)号:CN107396124B

    公开(公告)日:2019-09-20

    申请号:CN201710758241.6

    申请日:2017-08-29

    申请人: 南京大学

    发明人: 马展 陈彤 刘浩杰

    摘要: 本发明公开了一种基于深度神经网络的视频压缩方法,步骤如下:收集并整理视频图像数据集,构建神经网络训练集、测试集和交叉验证集;建立多层的深度神经网络;对于帧间预测,利用运动估计算法寻找最佳匹配块,并计算残差和帧间预测的均方差;预测完成后将残差作为新的训练数据训练残差编码网络,残差网络模型包括帧内残差和帧间残差;预测和残差神经网络的输出数据经过量化和无损熵编码一起作为固定长度码流的压缩数据;解码端通过与编码端对称的神经网络将压缩数据还原,并重建恢复出压缩后图像。本发明的视频压缩方法,与传统H.264视频编码方法在大量测试视频序列上的同等比较中,可以在相同质量上平均节省26%左右的码率。