-
公开(公告)号:CN118781389A
公开(公告)日:2024-10-15
申请号:CN202410766154.5
申请日:2024-06-14
Applicant: 浙江工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06N3/0464 , G16H50/20 , G16H30/00
Abstract: 一种利用多头注意力和并联连接的喉镜图像分类方法,包括:1)采集或选用喉镜图像构建训练数据集,并对原始喉镜图像进行边预处理;2)设计利用多头注意力和并联连接的网络模型;3)设计网络中的transformer Module部分;4)设计网络中的CNN Module部分;5)设计网络中的并联连接部分;6)设计利用多头注意力和并联连接的网络模型损失函数。本发明使用深度学习中的多头注意力和并联连接,融合了CNN网络与transformer网络对图像进行特征提取,最后获得图像的分类结果。
-
公开(公告)号:CN111986125B
公开(公告)日:2024-08-23
申请号:CN202010686619.8
申请日:2020-07-16
Applicant: 浙江工业大学
IPC: G06T5/40 , G06T5/90 , G06T7/90 , G06T7/11 , G06T3/4084 , G06N3/0464
Abstract: 一种用于多目标任务实例分割的方法方法,包括:步骤一,样本图像直方图均衡化处理;步骤二,构建多目标特征提取网络;步骤三,设计候选边界框,并对特征图上目标物体进行提取和分类;步骤四,利用非极大值抑制算法对多余的边界框进行剔除;步骤五,对候选边界框进行二值回归,以获得实例分割结果。本发明能够提高识别精度、加快识别效率的同时使用二值回归函数将目标物体从图像中分割出来,从而解决分割粗糙的问题。
-
公开(公告)号:CN113743269B
公开(公告)日:2024-03-29
申请号:CN202110987258.5
申请日:2021-08-26
Applicant: 浙江工业大学
IPC: G06V40/10 , G06V20/40 , G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/096
Abstract: 一种轻量化识别视频人体姿态的方法,首先对帧化处理后的RGB视频帧图像进行图像增强、引导滤波去噪等预处理,同时利用视频帧序列计算光流序列、提取光流特征图。然后通过构建轻量级的LHN模型提取RGB视频帧的特征,完成空间领域轻量、有效的人体姿态估计。接着设计LRDN模型以实现轻量化地完成光流特征提取,获取视频在时序领域的人体姿态信息。最后利用训练好的LHN模型和LRDN网络模型搭建并联式异构卷积神经网络,完成对视频人体姿态的准确估计。其中,利用以堆叠的L2标准化的softmax分数作为特征的多类别线性SVM将两个网络的softmax概率进行融合,最终选择最大概率值所对应的姿态类别为模型当前输入的视频帧序列所属的人体姿态类别。
-
公开(公告)号:CN111986252B
公开(公告)日:2024-03-29
申请号:CN202010685863.2
申请日:2020-07-16
Applicant: 浙江工业大学
IPC: G06V10/25 , G06V10/28 , G06V10/82 , G06N3/0464
Abstract: 一种用于目标分割网络中候选边界框精准定位的方法,包括:步骤一,构建轻量级的卷积神经网络模型,并设计网络参数;步骤二,求解网络模型中IoU layer的交并比IoU;步骤三,求解网络模型中候选边界框的置信度得分;步骤四,根据交并比和置信度得分的设定去除候选边界框冗余,最终使得输出的候选边界框其置信度得分最高,且最接近真实标定框。本发明能够在目标漏检和错误检测之间找到一个平衡之处,并且使得候选边界框更接近真实标定框,同时本发明所设计的网络结构和置信度求解方法具有一定的泛化能力,可以应用在较为复杂的场景中。
-
公开(公告)号:CN111985329B
公开(公告)日:2024-03-29
申请号:CN202010686704.4
申请日:2020-07-16
Applicant: 浙江工业大学
IPC: G06V20/10 , G06T7/13 , G06V10/82 , G06N3/0464 , G06T5/20 , G06T5/70 , G06T5/94 , G06T7/90 , G06T7/136 , G06V10/44
Abstract: 基于FCN‑8s和改进Canny边缘检测的遥感图像信息提取方法,首先利用FCN‑8s网络反卷积获取遥感图像地物像素区域图,然后对其进行加权平均灰度化处理,接着利用改进的Canny边缘检测获取灰度化后地物像素区域图上的目标地物边缘轮廓图,即利用综合考虑空间信息和色彩信息的双边滤波对灰度化后的图像进行去噪、平滑,然后计算平滑后图像中各点的梯度值和梯度方向,接着对梯度幅值进行改进的非极大值抑制处理以及图像线性边缘增强,获得候选边缘,紧接着采用基于最小类内均方差准则的自适应阈值算法获取最佳阈值,将最佳阈值作为选取高阈值、低阈值的基础,最后应用双阈值检测和连接边缘得到遥感图像目标地物的精细边缘轮廓图。本发明高效、适应性好。
-
公开(公告)号:CN112085802A
公开(公告)日:2020-12-15
申请号:CN202010721463.2
申请日:2020-07-24
Applicant: 浙江工业大学
Abstract: 一种基于双目摄像头获取三维指静脉图像的方法,包括:步骤一,采集双目视觉下的指静脉图像,利用双目摄像头获取不同测试者的同一根手指的两幅指静脉图像;步骤二,预处理指静脉图像,对指静脉图像的预处理主要包括图像灰度化、图像双边滤波、图像增强、图像二值化以及图像指静脉纹路的细化;步骤三,对二维指静脉图像进行三维重构,包括:(1)使用张氏标定法,获取双目摄像机的内外参数;(2)利用旋转矩阵进行极线校正;(3)通过立体匹配获取视差图;(4)对指静脉图像进行三维重构。本发明减少了计算量,可快速、便捷得到精准、细致的视差图,能较好地用于指静脉识别。
-
公开(公告)号:CN111985329A
公开(公告)日:2020-11-24
申请号:CN202010686704.4
申请日:2020-07-16
Applicant: 浙江工业大学
Abstract: 基于FCN-8s和改进Canny边缘检测的遥感图像信息提取方法,首先利用FCN-8s网络反卷积获取遥感图像地物像素区域图,然后对其进行加权平均灰度化处理,接着利用改进的Canny边缘检测获取灰度化后地物像素区域图上的目标地物边缘轮廓图,即利用综合考虑空间信息和色彩信息的双边滤波对灰度化后的图像进行去噪、平滑,然后计算平滑后图像中各点的梯度值和梯度方向,接着对梯度幅值进行改进的非极大值抑制处理以及图像线性边缘增强,获得候选边缘,紧接着采用基于最小类内均方差准则的自适应阈值算法获取最佳阈值,将最佳阈值作为选取高阈值、低阈值的基础,最后应用双阈值检测和连接边缘得到遥感图像目标地物的精细边缘轮廓图。本发明高效、适应性好。
-
公开(公告)号:CN110458841A
公开(公告)日:2019-11-15
申请号:CN201910535642.4
申请日:2019-06-20
Applicant: 浙江工业大学
Abstract: 一种提高图像分割运行速率的方法,包括:步骤一,设计多尺度空洞卷积核;步骤二,设计通道卷积网络;步骤三,设计全卷积连接与反卷积网络;本发明通过反卷积和全卷积操作的网络能够适用于任意图像大小尺寸,且能够对图像的每一像素点进行语义分析,达到快速分割图像的目的,并且能够对图像特征进行快速精确的定位。
-
公开(公告)号:CN109800778A
公开(公告)日:2019-05-24
申请号:CN201811463226.X
申请日:2018-12-03
Applicant: 浙江工业大学
IPC: G06K9/62
Abstract: 一种基于难分样本挖掘的Faster RCNN目标检测方法,包括:步骤1,基于深度学习的图像目标检测:步骤2,基于在线样本挖掘方法,采用的关键参数调整设置为:步骤3,负难分样本挖掘是在难分样本基础上通过调整训练中RPN形成的mini-batch正负样本比例为1:3,进行训练;步骤4,剔除冗余框,避免损失的多重计算。采用的是改进后的非极大值抑制算法将RPN层网络生成的建议框合理的去除冗余。本发明在不扩充样本的情况下,放宽负样本的定义,通过样本本身在线挖掘出更多的难训练样本;设置了正负样本比例,合理而简便地计算损失最大、难训练的、罕见的样本;对分类、边框回归的损失进行了平衡化处理,能够满足训练损失的持续降低。
-
公开(公告)号:CN109034024A
公开(公告)日:2018-12-18
申请号:CN201810774542.2
申请日:2018-07-16
Applicant: 浙江工业大学
CPC classification number: G06K9/00785 , G06K9/6267 , G06K2209/23 , G06N3/0454
Abstract: 本发明公开了一种基于图像目标检测的物流车辆车型分类识别方法,属于视频图像识别领域。所述物流车辆车型识别方法包括:采集物流园区的实时影像,用于车辆分类的训练图像使用;白化、标准化等数据预处理,用于图像数据的增强和统一化;卷积操作,用于提取车辆边框特征;激活操作,用于图像信号的滤波处理;最大池化操作,用于数据的降维和数据特征的高阶表示;热图,提取的图像高阶特征;边框回归,利用多尺度建议框对热图进行物流车辆位置的精确定位。本发明的优点在于:方便于物流园区对物流车辆类型的统计管理,并确保物流车辆的信息准确性,防止物流车辆统计错误以及计费不准确,还能精确统筹规划物流车辆的调度。
-
-
-
-
-
-
-
-
-