-
公开(公告)号:CN117793538B
公开(公告)日:2024-06-25
申请号:CN202410200816.2
申请日:2024-02-23
申请人: 北京理工大学 , 杭州电子科技大学丽水研究院 , 杭州电子科技大学
摘要: 本申请提出了一种图像自动曝光矫正与增强方法及装置,该方法包括:根据正常曝光Raw图像数据中的线性关系,构造有监督的异常曝光图像数据集;构建全局亮度调整网络与频率增强重建网络,将异常曝光图像数据集输入全局亮度调整网络,得到亮度矫正图像,将亮度矫正图像输入频率增强重建网络,得到矫正增强图像;基于矫正增强图像与正常曝光Raw图像数据,计算损失值,并基于损失值对其网络模型参数进行优化,得到优化模型;将其他图像输入优化模型得到优化图像,根据图像质量评价指标评价优化图像,得到客观评估指标。基于本申请提出的方案,能够对原始Raw图像数据达到自动曝光矫正与增强的效果,从而应对复杂环境下成像质量低的问题。
-
公开(公告)号:CN118570075A
公开(公告)日:2024-08-30
申请号:CN202410673250.5
申请日:2024-05-28
申请人: 杭州电子科技大学
IPC分类号: G06T5/50 , G06V10/56 , G06V10/774 , G06V10/80 , G06N3/0464 , G06N3/048
摘要: 本发明公开了一种基于RGB通道三边补偿的图像去摩尔纹方法,首先获取网络训练需要的图像数据集,然后构建基于RGB通道三边补偿的图像去摩尔纹网络模型,通过获得的图像数据集对构建的图像去摩尔纹网络模型进行训练;最后经过训练的模型接收需要进行去摩尔纹处理的图像,完成去摩尔纹处理后将图像输出。本发明创新的提出了使用不同通道分支提取不同通道下的图像信息,并从每个通道中分别学习不同尺度下的摩尔纹信息并加以去除并进行颜色恢复,使用多通道特征融合模块将不同通道下的图像特征进行融合,使得每个通道分支都能借鉴其它分支的特征来完善本尺度分支的特征,提高模型去除摩尔纹和恢复颜色的能力。
-
公开(公告)号:CN117409036A
公开(公告)日:2024-01-16
申请号:CN202311342514.0
申请日:2023-10-17
申请人: 杭州电子科技大学
IPC分类号: G06T7/246 , G06V20/52 , G06V10/774 , G06V10/82
摘要: 本发明公开了一种基于MAML的目标跟踪方法。首先获取用于训练目标跟踪网络的图像数据集;然后构建基于MAML的目标跟踪网络,包括骨干网络和跟踪器;其中骨干网络用于提取视频帧中的图像特征,跟踪器用于输出给定目标的位置和大小;再离线训练基于MAML的目标跟踪网络的骨干网络;使用MAML算法对目标跟踪网络的跟踪器进行训练;最后对目标跟踪网络进行微调。本发明可以有效解决直接将视频序列作为目标检测的训练集,样本量少的问题。创新的将BottleNeck层引入到残差块中,减少了网络的参数量,提高了目标跟踪任务的速度。
-
公开(公告)号:CN115222998A
公开(公告)日:2022-10-21
申请号:CN202211120458.1
申请日:2022-09-15
申请人: 杭州电子科技大学 , 浙江大华技术股份有限公司
发明人: 颜成钢 , 殷俊 , 颜拥 , 王洪波 , 胡冀 , 熊剑平 , 李亮 , 郑博仑 , 林聚财 , 孔书晗 , 王亚运 , 孙垚棋 , 金恒 , 朱尊杰 , 高宇涵 , 殷海兵 , 王鸿奎 , 陈楚翘 , 刘一秀 , 李文超 , 王廷宇 , 张勇东 , 张继勇
IPC分类号: G06V10/764 , G06V10/30 , G06V10/40 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种图像分类方法。首先构建通道维度注意力网络和空间维度多尺度自注意力网络;然后将输入图像预处理后输入通道维度注意力网络,生成基于通道维度的注意力特征图;将基于通道维度的注意力特征图输入至空间维度的多尺度自注意力网络,生成基于特征图空间维度的多尺度自注意力特征图;最后将最终生成的多维度多尺度注意力特征图输入到分类器单元中,将模型输出的向量转换成概率表示,完成图像分类。本发明设计了一种新的多尺度自注意力机制,它利用一系列的深度可分离卷积操作,生成特征信息高度相关的局部特征图和区域特征图,不但可以强化自注意力机制的细粒度特征提取能力,还可以高效的提取有效的全局信息。
-
公开(公告)号:CN117915204A
公开(公告)日:2024-04-19
申请号:CN202311470718.2
申请日:2023-11-07
申请人: 杭州电子科技大学
IPC分类号: H04N23/84 , G06T3/4015
摘要: 本发明公开了一种对于Bayer CFA图像的去马赛克方法。本发明方法利用不同类型Bayer CFA图像之间的隐含相关性,采用pattern embedding和独热编码的方式,提高了特征提取模型对Bayer CFA图像的特征提取能力。在此基础上,通过利用先预训练再微调(Fine‑tune)的训练模式,实现了去马赛克效果的提升。本发明提出了一种改进的transformer模块PSTB,可以对带有编码嵌入标记P的不同类型的Bayer CFA图像进行有针对性的学习,从而可以提高网络的特征提取能力,最终实现得到高水平的标准RGB图像的目的。
-
公开(公告)号:CN117911609A
公开(公告)日:2024-04-19
申请号:CN202311730771.1
申请日:2023-12-15
申请人: 杭州电子科技大学
IPC分类号: G06T17/00 , G06T15/00 , G06V10/26 , G06V20/70 , G06V40/10 , G06V40/20 , G06V20/40 , G06N3/0464 , G06N3/0495
摘要: 本发明公开了一种基于神经辐射场的三维手部建模方法,包括步骤如下:步骤(1)、通过双手手部分离模型进行双手模态分割;步骤(2)、通过手部去遮挡和移除模块获得单手图片;步骤(3)、单手蒙皮模型的结构化潜码;步骤(4)、单手蒙皮模型潜在代码扩散;步骤(5)、单手蒙皮模型手部密度和颜色回归;步骤(6)、对单手蒙皮模型进行手部体绘制得到双手手部模型。本发明使用了一种用于动态人体的新型隐式神经表示,这使本发明方法能够有效地合并视频帧上的观察。本发明方法可以在各种视点和不同级别的手间遮挡下获得高质量的重建性能。
-
公开(公告)号:CN113538338B
公开(公告)日:2024-04-02
申请号:CN202110672308.0
申请日:2021-06-17
申请人: 杭州电子科技大学
IPC分类号: G06T7/00
摘要: 本发明公开了一种基于限制性预测滤波的图像散景渲染方法及系统,首先准备数据集并对数据进行预处理;构建基于限制性预测滤波的图像散景渲染网络;图像散景渲染网络包括限制性预测滤波模块和显著性检测模块,其中显著性检测模块用于检测输入全聚焦图片中的显著性特征,限制性预测滤波模块用于保留显著性检测模块检测到的显著性特征,并对输入图片的其他部分进行限制性滤波操作,模糊图片内容从而产生散景渲染效果;通过数据集训练图像散景渲染网络模型。本发明方法使用三种参数类型的限制性预测滤波核对图片进行自适应滤波,从而实现散景渲染处理,创新的提出了一种限制性预测滤波模块用于实现图像的散景渲染处理。
-
公开(公告)号:CN113538231B
公开(公告)日:2024-04-02
申请号:CN202110672302.3
申请日:2021-06-17
申请人: 杭州电子科技大学
IPC分类号: G06T3/4076 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于像素分布估计的单张图像超分辨重建系统及方法,首先进行数据预处理获得高分辨率图片IHR和低分辨率图片ILR;然后构建并训练基于像素分布估计的图像超分辨重建网络,包括权重提取模块和像素分布估计模块;权重提取模块用于从输入的低分辨率图片ILR中计算出像素分布估计模块所需要的权重,而像素分布估计模块根据预先设定的倍数s对输入图片像素的邻域像素相对坐标进行像素估计,实现图像的超分辨重建过程。本发明方法从像素分布估计的角度解释并实现了图像超分辨重建,模型结构简单,权重学习模块结构用卷积层就可以很好的学习,运算成本低,且效果好。
-
公开(公告)号:CN117612264A
公开(公告)日:2024-02-27
申请号:CN202311721804.6
申请日:2023-12-14
申请人: 杭州电子科技大学
IPC分类号: G06V40/20 , G06V10/762 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于图卷积网络的人体动作识别方法。首先获取基于骨架的动作识别数据集。对数据集中的缺失数据进行特征插补,得到补全后的输入序列;通过加权邻接矩阵构造方法,获得改进的加权邻接矩阵;然后根据改进的加权邻接矩阵训练网络框架;网络框架由两部分组成:GCN网络以及SoftMax分类器。最后通过训练好的网络框架对待识别的人体图序列S进行人体动作识别。本发明通过在单个人体动作识别管道中结合缺失联合处理预处理步骤和一种新颖的邻接矩阵构建方法来提高基于GCN的方法的人类动作识别性能。同时本发明的框架更轻量化,具有更少的可学习参数。
-
公开(公告)号:CN117408962A
公开(公告)日:2024-01-16
申请号:CN202311342512.1
申请日:2023-10-17
申请人: 杭州电子科技大学
IPC分类号: G06T7/00 , G06T7/11 , G06N3/0464
摘要: 本发明公开了一种基于双重U‑Net卷积神经网络的3D医学图像分割方法。首先进行数据预处理;然后构建基于双重U‑Net卷积神经网络的3D医学图像分割的训练网络,训练该网络形成产生具有3D医学图像分割效果的网络模型;经过训练的3D医学图像分割网络模型接收预处理后的数据集中的测试集图像,完成分割处理后将图像输出,验证3D医学图像分割网络模型效果。相比于现有的使用全卷机神经网络的分割方法,本发明方法能获得更大的感受野和更高的分辨率特征。相比于现有使用基于transformer的分割方法了,本发明方法需要更少的训练数据集和更少的内存以及计算成本。
-
-
-
-
-
-
-
-
-