-
公开(公告)号:CN113554567A
公开(公告)日:2021-10-26
申请号:CN202110865456.4
申请日:2021-07-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于小波变换的鲁棒去重影系统及方法。从低动态范围图像输入中提取多尺度特征图,并生成相应的空间注意图,以引导无参考图像识别未对准部分,从而减轻合并阶段的重影效应。在空间注意力映射的帮助下,融合模块融合LDR图像的特征映射,并最终从不同尺度重建高动态范围输出。本发明提出了一种新的跨变换域学习体系结构,由离散小波变换和离散余弦变换两种变换构成,即离散小波变换首先将特征分解为不同的频率分量,然后引入基于离散余弦变换的可学习带通滤波器生成与分解分量一致的局部特征。
-
公开(公告)号:CN113538444A
公开(公告)日:2021-10-22
申请号:CN202110728327.0
申请日:2021-06-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于空洞卷积的并行空间金字塔模型图像分割方法。本发明包括如下步骤:步骤1、提取输入图像特征:对于给定的输入图像,通过残差网络提取得到特征图;步骤2、构建并行空间金字塔模型:步骤3、特征图拼接:在得到并行空间金字塔模型中不同感受野下的特征图后,将其与步骤1中得到的特征图拼接在一起,得到一个多维特征图;步骤4、输出分割结果图:将多维特征图经过卷积降维后,使用softmax函数得到分割结果图。本发明结合空洞卷积和空间金字塔模型在获取不同感受野的特征图的同时极大的补足细节特征,提高图像分割结果的精确度。
-
公开(公告)号:CN113538346A
公开(公告)日:2021-10-22
申请号:CN202110728340.6
申请日:2021-06-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于双型U‑Net模型的医学图像分割方法。本发明实现步骤:步骤1、获取图像数据集,并进行图像增强预处理;步骤2、将预处理后的数据集划分为训练集、验证集和测试集;步骤3、搭建双型U‑Net网络模型,使用预训练的VGG19替换模型的第一个编码器,对原U‑Net网络进行改进,加入ASPP获取网络模型的上下文信息;步骤4、设计损失函数,评估指标;步骤5、将待分割图像输入到网络模型中进行训练,得到分割结果:将训练集、验证集和测试集分别输入到网络模型中,得到输出图像以及对应的评估指标结果。本发明提高了模型的分割准确率,并有效改善了模型泛化能力和鲁棒性。使得分割网络获取高分辨率的特征图,进而带来优异的表现。
-
公开(公告)号:CN113536987A
公开(公告)日:2021-10-22
申请号:CN202110727405.5
申请日:2021-06-29
Applicant: 杭州电子科技大学
Abstract: 本发明公开一种快速的室内场景理解方法,首先利用RGB‑D传感器获得室内整体的3D扫描数据;检测出场景平面,并对平面赋予语义信息,将场景平面去除,仅留下物体;对物体进行语义分割,应用平面语义标签;最后应用树形图对场景进行理解。本发明通过去除布局layout,能够获得更为简洁的物体表示,以便于后续的物体分割识别。
-
公开(公告)号:CN113534434A
公开(公告)日:2021-10-22
申请号:CN202110736666.3
申请日:2021-06-30
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于LED阵列的光谱显微成像装置及其实现方法,光谱显微成像装置包括依次设置的15×15单光源窄光谱红光光源LED阵列,载物台,显微物镜,视场光阑,4F中继透镜,阿米西棱镜,带通滤波器,微透镜阵列和CCD阵列工业相机;所述的4F中继透镜共有两组,分别设置在视场光阑和阿米西棱镜之间以及带通滤波器和微透镜阵列之间;本发明装置通过光路设计,达到15×15单光源窄光谱红光光源LED阵列中单一波长的LED灯逐一点亮225次即可同时获得观测样本多路单个连续光谱通道,可以实时获得观察样本单个光谱图像视频信息,无时间延时,无计算耗时;本发明装置采用了阿米西棱镜,其体积较小并且可以使物镜和目镜位于一条直线上,且阿米西棱镜不会受限于全反射的临界角,能接受较大角度的入射光。
-
公开(公告)号:CN113238928A
公开(公告)日:2021-08-10
申请号:CN202110441589.9
申请日:2021-04-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种音视频大数据任务的端云协同评测系统,包括存储模块,通信模块,管理模块,运行模块,评测模块,以及云端计算资源模块。管理模块通过通信模块将存储模块中的文件程序传输到云端计算资源模块,通过运行模块和评测模块完成音视频任务的运行评测,管理模块通过集群管理服务,通过资源的监控调度,能够提高云端计算资源的利用效率,同时通过建立容器的方式,各个运行程序环境之间互不冲突。
-
公开(公告)号:CN113160179A
公开(公告)日:2021-07-23
申请号:CN202110442873.8
申请日:2021-04-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于动态区域卷积的图像去模糊方法,首先构造动态卷积层,在输入的不同区域中使用不同的卷积核进行卷积;然后使用动态卷积层构造生成器,将模糊图转变为清晰图像;构造判别器,与生成器构成生成对抗网络,并使用真实的清晰图像与生成器生成的清晰图像的损失网络进行训练;训练结束后,仅保留生成器;将模糊图像输入训练后的生成器即可获得清晰图像。本发明利用动态卷积,考虑到了输入数据的区域之间的差异性,针对不同区域使用不同卷积核进行卷积,从而提升特征提取能力。由动态卷积构造的生成对抗网络在单张图像去模糊任务中性能有所提升。
-
公开(公告)号:CN113160177A
公开(公告)日:2021-07-23
申请号:CN202110441623.2
申请日:2021-04-23
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于超像素和图卷积网络的平面分割方法;首对输入的彩色图像进行预处理,获得预处理后的图像;然后根据图像分辨率,将预处理后的图像分割为合适数量的超像素,并转化为无向图结构;构造图卷积网络,并使用数据集对其进行训练;最后使用训练好的图卷积网络对超像素构成的图进行预测,给每一个超像素进行平面分类,从而完成平面分割。本发明将图像分割为超像素,可以很好地保留原始图像中的边缘信息,并减轻后续图神经网络的学习负担,防止分割出的平面边缘与实际情况差距过大;利用现有数据集,通过特定算法提取特定标签,作为后续监督神经网络学习的训练集,解决了没有针对平面分割数据集的问题,避免了人工标记的巨大成本。
-
公开(公告)号:CN119230006A
公开(公告)日:2024-12-31
申请号:CN202411275784.9
申请日:2024-09-12
Applicant: 杭州电子科技大学
IPC: G16C20/30 , G16C20/70 , G06N3/042 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种基于多任务图神经网络的分子属性预测方法,首先根据场景确定分子属性预测任务;然后根据确定的任务选择相关训练数据并进行预处理;针对每个任务搭建使用图神经网络训练;再结合所有任务,组成多任务图神经网络,确定全局目标损失函数;最后基于预处理后的数据对多任务图神经网络进行训练,得到最优的图神经网络模型。本发明针对分子结构相关的图数据保持良好的学习效率,在预测分子结构全局或者局部性质上有良好的表现。本发明提升了分子结构的预测速度和效率,相比较传统方法有着较大提升,是深度学习和分子结构预测的良好融合。
-
公开(公告)号:CN113159034B
公开(公告)日:2024-11-15
申请号:CN202110442856.4
申请日:2021-04-23
Applicant: 杭州电子科技大学
IPC: G06V20/62 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/049 , G06N3/08 , G06F16/951
Abstract: 本发明公开了一种短视频自动生成字幕的方法及系统。通过3D卷积网络进行视频的特征提取,获得视频特征序列,使用DAPs模型对接收到的视频特征序列进行事件检测,得到预测的事件片段并且对每个片段打分。单独处理获得的每个事件片段,首先对事件片段进行视觉嵌入操作,然后将进行视觉嵌入操作后的事件片段输入Transformer模型中,通过获得预测的文本。本发明通过融合跨模态技术,前期处理包含事件检测,缩小了后续文本生成工作的范围,增加了生成的文本与事件的匹配度。文本生成部分发挥Transformer在特征编码、解码方面的出色表现。
-
-
-
-
-
-
-
-
-