-
公开(公告)号:CN113128460A
公开(公告)日:2021-07-16
申请号:CN202110491450.5
申请日:2021-05-06
Applicant: 东南大学
Abstract: 本发明公开了一种基于知识蒸馏的多分辨率行人重识别方法,利用知识蒸馏迫使浅层特征可以学习深层特征,从而提高浅层特征的表征能力。同时,将浅层特征与深层特征拼接得到对多分辨率更具有表征的特征,损失函数分别计算三个表征的分类损失函数,提升每个表征的判别不同行人的能力,在计算不同行人的距离时,利用拼接后的表征作为行人的最终表征。实验结果表明本发明提出的方法有效提升了行人重识别的准确率。
-
公开(公告)号:CN113052764B
公开(公告)日:2022-11-08
申请号:CN202110418081.7
申请日:2021-04-19
Applicant: 东南大学
IPC: G06T3/40 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于残差连接的视频序列超分重建方法,包括以下步骤,对视频数据进行视频帧提取,将视频数据抽帧为图像集,进行时序拆分并随机加噪进行数据扩增;将数据进行随机裁剪,并输入到前端的3D卷积层中,并将卷积层拆分为两层,进行时序动态信息融合,得到浅层特征;将浅层特征进行深层特征处理并进行上采样,得到单帧图像;将单帧图像集进行合并得到视频序列;进行网络模型训练,当训练损失收敛且图像视觉指标PSNR上升稳定后保存网络模型,最后进行测试集推理。通过本发明可以降低模型参数量与计算量,使得超分结果更加的光滑、真实,保证PSNR性能指标并增强可视化效果,缓解输出视频中的局部跳帧问题,从而有效提升了超分视频的视觉效果。
-
公开(公告)号:CN113052764A
公开(公告)日:2021-06-29
申请号:CN202110418081.7
申请日:2021-04-19
Applicant: 东南大学
Abstract: 本发明公开了一种基于残差连接的视频序列超分重建方法,包括以下步骤,对视频数据进行视频帧提取,将视频数据抽帧为图像集,进行时序拆分并随机加噪进行数据扩增;将数据进行随机裁剪,并输入到前端的3D卷积层中,并将卷积层拆分为两层,进行时序动态信息融合,得到浅层特征;将浅层特征进行深层特征处理并进行上采样,得到单帧图像;将单帧图像集进行合并得到视频序列;进行网络模型训练,当训练损失收敛且图像视觉指标PSNR上升稳定后保存网络模型,最后进行测试集推理。通过本发明可以降低模型参数量与计算量,使得超分结果更加的光滑、真实,保证PSNR性能指标并增强可视化效果,缓解输出视频中的局部跳帧问题,从而有效提升了超分视频的视觉效果。
-
公开(公告)号:CN113128461B
公开(公告)日:2022-11-08
申请号:CN202110492149.6
申请日:2021-05-06
Applicant: 东南大学
Abstract: 本发明公开了一种基于人体关键点挖掘全尺度特征的行人重识别性能提升方法,利用人体关键点作为行人的局部特征,缓解遮挡情况下的行人的全局特征判别性不足的问题,将由人体关键点网络得到的关键点热力图结合到行人重识别网络,增加局部特征。同时,对关键点预测可见性,将可见性应用到损失函数与特征距离计算中,缓解不可见的局部特征对网络性能的负面影响。实验结果表明本发明提出的方法有效提升了行人重识别的准确率。
-
公开(公告)号:CN113076930A
公开(公告)日:2021-07-06
申请号:CN202110456980.6
申请日:2021-04-27
Applicant: 东南大学
Abstract: 本发明公开了一种基于共享骨干网络的人脸识别与表情分析方法,包括以下步骤,对深层骨干网络进行训练并保存训练后的深层网络模型,对深层网络模型进行压缩,得到轻量级骨干网络模型;对表情分析网络进行训练并保存训练后的表情分析网络模型;将待测视频帧输入人脸检测与对齐模块进行预处理,检测出人脸位置,并得到标准人脸;将标准人脸输入到轻量级骨干网络中,输出人脸特征向量;将人脸特征向量与人脸底库中的人脸特征向量进行比对,输出人脸识别结果;将人脸特征向量输入到表情分析网络,输出表情分析结果。通过本发明可以降低了网络模型的计算量,提高了模型在实际应用中的人脸识别和表情分析的效率。
-
公开(公告)号:CN113160056A
公开(公告)日:2021-07-23
申请号:CN202110419139.X
申请日:2021-04-19
Applicant: 东南大学
Abstract: 本发明公开了一种基于深度学习的带噪图像超分辨率重建方法,包括以下步骤,对数据集中的高分辨率图像进行降采样和加噪声处理,生成模拟低分辨率晰度图像和模拟相机图像;构建整体网络对模拟样本进行超分重建;对整体网络的输出端添加Patch‑GAN结构,从而减少重建后的噪声,对整体网络完成初步训练;对未加噪声的低分辨率晰度图像利用边缘提取算子提取边缘部分,选择边缘图块的模和大于阈值部分进入新训练数据集,利用边缘丰富的图像块微调网络。通过本发明可以利用Patch‑GAN使得网络更专注于图像细节部分,同时为了规避图片随机裁剪的影响,在训练过程中选取边缘区域的像素块加入新数据集并微调网络模型,能够针对带噪图片超分重建取得较好的视觉效果。
-
公开(公告)号:CN113128460B
公开(公告)日:2022-11-08
申请号:CN202110491450.5
申请日:2021-05-06
Applicant: 东南大学
Abstract: 本发明公开了一种基于知识蒸馏的多分辨率行人重识别方法,利用知识蒸馏迫使浅层特征可以学习深层特征,从而提高浅层特征的表征能力。同时,将浅层特征与深层特征拼接得到对多分辨率更具有表征的特征,损失函数分别计算三个表征的分类损失函数,提升每个表征的判别不同行人的能力,在计算不同行人的距离时,利用拼接后的表征作为行人的最终表征。实验结果表明本发明提出的方法有效提升了行人重识别的准确率。
-
公开(公告)号:CN113076930B
公开(公告)日:2022-11-08
申请号:CN202110456980.6
申请日:2021-04-27
Applicant: 东南大学
Abstract: 本发明公开了一种基于共享骨干网络的人脸识别与表情分析方法,包括以下步骤,对深层骨干网络进行训练并保存训练后的深层网络模型,对深层网络模型进行压缩,得到轻量级骨干网络模型;对表情分析网络进行训练并保存训练后的表情分析网络模型;将待测视频帧输入人脸检测与对齐模块进行预处理,检测出人脸位置,并得到标准人脸;将标准人脸输入到轻量级骨干网络中,输出人脸特征向量;将人脸特征向量与人脸底库中的人脸特征向量进行比对,输出人脸识别结果;将人脸特征向量输入到表情分析网络,输出表情分析结果。通过本发明可以降低了网络模型的计算量,提高了模型在实际应用中的人脸识别和表情分析的效率。
-
公开(公告)号:CN113128461A
公开(公告)日:2021-07-16
申请号:CN202110492149.6
申请日:2021-05-06
Applicant: 东南大学
Abstract: 本发明公开了一种基于人体关键点挖掘全尺度特征的行人重识别性能提升方法,利用人体关键点作为行人的局部特征,缓解遮挡情况下的行人的全局特征判别性不足的问题,将由人体关键点网络得到的关键点热力图结合到行人重识别网络,增加局部特征。同时,对关键点预测可见性,将可见性应用到损失函数与特征距离计算中,缓解不可见的局部特征对网络性能的负面影响。实验结果表明本发明提出的方法有效提升了行人重识别的准确率。
-
公开(公告)号:CN113076929A
公开(公告)日:2021-07-06
申请号:CN202110456897.9
申请日:2021-04-27
Applicant: 东南大学
Abstract: 本发明公开了一种角度余量自适应的人脸识别模型训练方法,包括以下步骤,基于人脸识别数据集,进行预训练,得到预训练模型;将人脸识别数据集中的样本输入预训练模型,得到对应的特征向量;对数据集中的每个类别,分别求出对应的类内方差;根据所得每个类别对应的类内方差,得到对应的角度余量大小;结合每个类别的角度余量和加法角度余量损失函数,构成类别角度余量自适应的加法角度余量损失函数;用类别角度余量自适应的加法角度余量损失函数监督人脸识别模型进行训练,得到最终的人脸识别模型并可用于人脸识别。通过本发明可以实现在角度余量损失函数的基础上,引入了类别自适应角度余量算法,使得训练出的模型具有更高的准确率和泛化能力。
-
-
-
-
-
-
-
-
-