-
公开(公告)号:CN110276378A
公开(公告)日:2019-09-24
申请号:CN201910417419.X
申请日:2019-05-20
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于无人驾驶技术来对实例分割进行改进的方法。本发明提出在基于MASK R-CNN的Faster R-CNN基础上对目标进行检测以及分类,之后通过FCN特征粗提取以及CRF优化输出从而实现实例分割。具体实现步骤如下:步骤1、使用偏监督的方法对目标进行分类;步骤2、在语义分割卷积过程中采用深度可分离卷积,获取特征;步骤3、对卷积层得到的特征进行特征融合优化,在低层引入语义信息,在高层引入空间信息。本发明使用较低的成本便建立了较好的目标检测及分类结果。本发明采用深度可分离卷积,提高分割结果的精度以及计算机的效率,减少时间的损耗。
-
公开(公告)号:CN110276260A
公开(公告)日:2019-09-24
申请号:CN201910429812.0
申请日:2019-05-22
Applicant: 杭州电子科技大学 , 北京京东尚科信息技术有限公司
Abstract: 本发明公开了一种基于深度摄像头的商品检测方法,本发明包括以下步骤:1)利用深度摄像头获取摆放在结算台上的商品的深度信息及商品的深度图像。2)将深度信息转为灰度图像,从而使得灰度信息可视化;3)对去除背景噪声后的灰度图像进行图像增强;4)图像分割,设置合适的阈值将灰度图像转为二值图像,背景为黑色,感兴趣的商品区域为白色。5)边缘检测,对感兴趣的商品区域进行轮廓检测,找到商品的边缘轮廓,根据轮廓生成所需的包围盒信息。本发明无需提前采集大量数据训练检测模型,通过利用深度信息,基于传统图像处理方法即可获得商品的检测结果,节约成本,提高效率。
-
公开(公告)号:CN110236483A
公开(公告)日:2019-09-17
申请号:CN201910520291.X
申请日:2019-06-17
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度残差网络的糖尿病性视网膜病变检测的方法。本发明步骤如下:步骤1:数据集的筛选;步骤2:眼底图像的预处理,步骤3:数据集扩充,将部分样本较少的类中的图像做图像扩充处理,具体操作包括将图像镜像和旋转;步骤4:数据集标签的制作;步骤5:训练集和测试集的构建;步骤6:卷积神经网络的搭建;步骤7:网络训练;步骤8:网络测试。本发明能够获得更高的检测病变的准确性,同时进行检测的时间也可以大大缩短。
-
公开(公告)号:CN110189330A
公开(公告)日:2019-08-30
申请号:CN201910276000.7
申请日:2019-04-08
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于深度学习的背景去除的方法。本发明包括如下步骤:步骤1、对初期数据库的建立,通过采用对COCO数据集的整理以及添加修改得到所需要的对初期数据库;并找到对初期数据库中图片原始信息匹配所对应的标签信息;对初期数据库以及其所对应的标签信息进行预处理操作,包括图像正则化和图像格式转换;步骤2、将步骤1得到的初期数据库作为原始训练数据输入到提拉米苏Tiramisu网络中,得到基本的背景去除的模型;步骤3、将待识别的图片作为输入数据输入到上述模型中进行识别,得到识别结果。本发明实现全自动化操作,只需将所需要进行操作的图片输入到模型中即可自动完成背景去除的目的。
-
公开(公告)号:CN110177282A
公开(公告)日:2019-08-27
申请号:CN201910388829.6
申请日:2019-05-10
Applicant: 杭州电子科技大学
IPC: H04N19/503 , H04N19/42 , H04N19/124 , G06N3/04
Abstract: 本发明公开了一种基于SRCNN的帧间预测方法,其特征在于使用超分辨率卷积神经网络对图像序列进行帧间预测;对图像序列做运动估计和运动补偿操作后,结合超分辨率卷积神经网络训练出特征模型;使用模型中的参数对图像进行超分辨率重建,同时对图像进行运动估计和运动补偿,得到与当前图像的下一帧图像一致的图像。本发明将深度学习应用到视频编码的帧间预测,使用卷积神经网络,对图像序列间的运动估计、运动补偿操作进行特征提取和训练学习。同时,使用超分辨率神经网络,在图像重建时,图像的画质会得到增强。
-
公开(公告)号:CN110083715A
公开(公告)日:2019-08-02
申请号:CN201910212744.2
申请日:2019-03-20
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于核稀疏表示的三维模型分类检索方法。本发明步骤如下:1、运用一种基于二次误差作为度量代价的边收缩算法对以点云形式表示的三维模型进行顶点简化处理;2、计算顶点简化后三维模型的方向,保证同类模型在方向上能够对齐,通过计算得到了三维模型的三个特征方向向量;3、基于三个特征方向向量对三维模型进行渲染,得到相应不同方向上的多张不同渲染图像;4、针对不同数据集中三维模型的特点,综合考虑数据特征与描述符特征,选定特征描述符提取渲染图像的特征;5、利用改进的核稀疏表示分类器对提取的特征向量进行匹配,进而实现对三维模型的分类检索工作。本发明具有一定的鲁棒性,取得了较为高效、可靠的优越性能。
-
公开(公告)号:CN110059205A
公开(公告)日:2019-07-26
申请号:CN201910213225.8
申请日:2019-03-20
Applicant: 杭州电子科技大学
Abstract: 本发明提出了一种基于多视图的三维模型分类检索方法。本发明具体实现如下:1、将三维模型数据进行预处理;2、获取三维模型的多角度渲染视图,在12个不同的视点处对三维模型进行投影得到其相应角度的渲染视图;3、提取三维模型渲染视图的特征,将每一个渲染视图分解成多个同心正方形,通过在两个连续同心正方形之间的图像灰度差异来获得渲染视图的特征;4、利用SVM分类器对三维模型进行分类检索。本发明方法通过一系列的预处理后,渲染得到三维模型不同角度下的视图,然后利用改进过的多分类SVM分类器实现了针对三维模型的分类检索任务,具有一定的鲁棒性,取得了较为高效、可靠的优越性能。
-
公开(公告)号:CN119131174A
公开(公告)日:2024-12-13
申请号:CN202411264576.9
申请日:2024-09-10
Applicant: 杭州电子科技大学
IPC: G06T11/00 , G06T5/30 , G06T5/60 , G06V40/10 , G06V10/44 , G06V10/54 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084 , G06N3/094
Abstract: 本发明公开了一种姿态驱动的基于注意力机制的人物图像合成方法。首先通过骨架编码器将目标骨架转换为特征映射,通过外观编码器将原图像转换为特征映射;利用多尺度图像细化网络对提取的特征进行多尺度图像细化,获得最终目标人物图像;最后以端到端方式训练模型,同时学习特征融合和目标图像生成。本发明提出了一种姿态驱动的注意力机制,能够有效提取外观特征和姿态特征,通过通道注意力机制的自适应权重获取不同关注度的特征图。最终按权重相加输出,有利于在姿态变换中不丢失原始特征最大程度保留了原图像的信息。
-
公开(公告)号:CN113159048B
公开(公告)日:2024-12-13
申请号:CN202110441665.6
申请日:2021-04-23
Applicant: 杭州电子科技大学
IPC: G06V10/26 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的弱监督语义分割方法;首先利用已有的数据集在预训练的Resnet50上进行微调,然后利用训练好的Resnet50得到相应的类激活图,利用设定的阈值得到分割的伪标签,并采用全连接的条件随机场Dense conditional random fields,Dense CRF)对标签进行优化。最后,利用优化后的伪标签训练分割网络。本发明所述的方法只需使用图像级别的标签就可以完成目标的分类以及语义分割任务,极大了减少了人工标注所耗费的大量的人力物力。相比于现有的弱监督方法,本方法效率更高,定位结果更加准确。
-
公开(公告)号:CN113536979B
公开(公告)日:2024-11-12
申请号:CN202110720404.8
申请日:2021-06-28
Applicant: 杭州电子科技大学
IPC: G06V40/10 , G06V10/774 , G06V10/764 , G06V10/762 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于混合存储器的联合训练跨域行人重识别方法,首先进行数据集预处理,通过源域数据集对在ImageNet上预训练的ResNet‑50进行预训练,获得baseline模型;然后将源域数据集和目标域数据集组合形成联合数据集,通过联合数据集对baseline模型进行训练并优化;本发明方法通过将源域和目标域数据集联合训练,可以进一步利用源域数据集中丰富的标注信息,同时可以进一步缩小域差异,从而实现更好的自适应效果;通过生成基于相似性和混合存储器的多类别标签,可以在源域和目标域同时搜索相似图像,进一步提高模型的性能,而且可以避免类似基于聚类算法中的聚类噪声。
-
-
-
-
-
-
-
-
-