-
公开(公告)号:CN118379387B
公开(公告)日:2024-10-01
申请号:CN202410822182.4
申请日:2024-06-25
申请人: 浙江大学
IPC分类号: G06T11/00 , G06T5/60 , G06N3/0455 , G06N3/0464 , G06N3/09 , G06F40/30 , G06V10/25 , G06V10/26 , G06V20/70 , G06V10/764 , G06V10/766 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/048
摘要: 本发明提供了一种基于基础模型的单域泛化方法,涉及图像处理技术领域,所述方法包括:通过扩散模型生成目标风格图像;根据图像语言转换模型,对所述目标风格图像进行风格统计,获得风格信息;获取源图像,根据所述图像语言转换模型处理所述源图像,获得输出特征;对所述输出特征和所述风格信息进行风格迁移,获得风格增强图像,以实现域的泛化。保证提升识别模型在未知领域中的适应能力。
-
公开(公告)号:CN116229350A
公开(公告)日:2023-06-06
申请号:CN202211703773.7
申请日:2022-12-29
申请人: 宁波宏大电梯有限公司 , 浙江大学
IPC分类号: G06V20/52 , G06V20/40 , G06V10/764 , G06V10/766 , G06V10/774 , G06V10/82 , G06T7/11 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种扶梯踏板缝隙实时检测方法与系统,涉及扶梯踏板检测领域,本发明以YOLOX模型为基础模型,使用transformer模块替换基础模型中的卷积激活层,使用上采样扩张模块替换基础模型中的上采样模块,得到第一YOLOX模型,并通过包括被标注的带缝隙色块、未被标注的不带有色块的缝隙图块的数据集训练第一YOLOX模型,并在训练过程中利用损失函数获取到改进的YOLOX模型,将扶梯踏板图像输入至改进的YOLOX模型,检测得到带缝隙色块检测图片,通过HSV模型对带缝隙色块检测图片进行颜色分割,得到对应的黑白灰度图,获取黑白灰度图中黑色区域所占的像素宽度即扶梯踏板缝隙的宽度,其利用视觉目标检测和图像分割技术实现了对扶梯踏板缝隙的实时检测。
-
公开(公告)号:CN118379568B
公开(公告)日:2024-09-24
申请号:CN202410834565.3
申请日:2024-06-26
申请人: 浙江大学
IPC分类号: G06V10/764 , G06V10/74 , G06V10/778
摘要: 本发明提供了一种基于多教师模型的知识蒸馏方法,涉及图像处理技术领域,所述方法包括:确定多个教师模型中的主模型,将其他的教师模型作为辅模型;将辅模型的特征方向与主模型对齐,获得对齐特征;将对齐特征沿第二维度与主模型的特征叠加获得扩展特征,其中,扩展特征的特征维度高于主模型或辅模型的维度;对学生模型的中间层进行特征映射,获得映射特征;对扩展特征进行掩码处理,获得第一掩码特征;映射特征进行掩码处理,获得第二掩码特征;根据第一掩码特征和第二掩码特征确定掩码范数方向损失;根据损失函数优化学生模型,通过优化后的学生模型对图片进行分类识别,保证有效减少多教师模型知识蒸馏带来的知识损失。
-
公开(公告)号:CN118379568A
公开(公告)日:2024-07-23
申请号:CN202410834565.3
申请日:2024-06-26
申请人: 浙江大学
IPC分类号: G06V10/764 , G06V10/74 , G06V10/778
摘要: 本发明提供了一种基于多教师模型的知识蒸馏方法,涉及图像处理技术领域,所述方法包括:确定多个教师模型中的主模型,将其他的教师模型作为辅模型;将辅模型的特征方向与主模型对齐,获得对齐特征;将对齐特征沿第二维度与主模型的特征叠加获得扩展特征,其中,扩展特征的特征维度高于主模型或辅模型的维度;对学生模型的中间层进行特征映射,获得映射特征;对扩展特征进行掩码处理,获得第一掩码特征;映射特征进行掩码处理,获得第二掩码特征;根据第一掩码特征和第二掩码特征确定掩码范数方向损失;根据损失函数优化学生模型,通过优化后的学生模型对图片进行分类识别,保证有效减少多教师模型知识蒸馏带来的知识损失。
-
公开(公告)号:CN115690745A
公开(公告)日:2023-02-03
申请号:CN202211424631.7
申请日:2022-11-14
申请人: 浙江大学宁波“五位一体”校区教育发展中心
摘要: 本发明公开了一种基于无人机单目视觉的车辆全自动测速方法、系统及装置,所述方法包括以下步骤:首先将无人机在空中悬停,拍摄行车区域的视频并提取ROI区域,并对获得的视频进行晃动补偿,去除视频帧的非正常偏移;然后通过Yolo_v3算法对各视频帧进行车辆检测,获得车辆的边界框,并通过Deep_SORT算法对提取到的车辆进行跟踪,得到视频视野内每辆被检测车辆的轨迹线;最后通过车辆边界框的平均长度和现实中车辆的平均长度得到距离参考,并基于距离参考和像素速度计算车辆的速度。本发明可以仅凭借无人机单目视觉全自动获取车辆行驶速度,不需要额外的人工操作。
-
公开(公告)号:CN115640834A
公开(公告)日:2023-01-24
申请号:CN202211363379.3
申请日:2022-11-02
申请人: 浙江大学
IPC分类号: G06N3/0464 , G06N3/082 , G06V10/82
摘要: 本申请涉及通道修剪方法、装置、计算机设备及存储介质,应用于包含卷积层的神经网络,神经网络应用于图像处理,卷积层包括通道,所述方法包括:根据图像数据,获取卷积层的秩;根据图像数据,获取卷积层的熵;根据卷积层的秩和熵,获取卷积层的总体指标;根据总体指标得到每个卷积层的修剪比;获取卷积层中通道的沙普利值;根据通道的沙普利值和卷积层的修剪比,对卷积层中的通道进行修剪。本发明的通道修剪方法,能通过通道修剪,提高神经网络的性能,从而提高图像处理的效率。
-
公开(公告)号:CN118379387A
公开(公告)日:2024-07-23
申请号:CN202410822182.4
申请日:2024-06-25
申请人: 浙江大学
IPC分类号: G06T11/00 , G06T5/60 , G06N3/0455 , G06N3/0464 , G06N3/09 , G06F40/30 , G06V10/25 , G06V10/26 , G06V20/70 , G06V10/764 , G06V10/766 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/048
摘要: 本发明提供了一种基于基础模型的单域泛化方法,涉及图像处理技术领域,所述方法包括:通过扩散模型生成目标风格图像;根据图像语言转换模型,对所述目标风格图像进行风格统计,获得风格信息;获取源图像,根据所述图像语言转换模型处理所述源图像,获得输出特征;对所述输出特征和所述风格信息进行风格迁移,获得风格增强图像,以实现域的泛化。保证提升识别模型在未知领域中的适应能力。
-
公开(公告)号:CN116012711A
公开(公告)日:2023-04-25
申请号:CN202310021496.X
申请日:2023-01-07
申请人: 浙江大学
IPC分类号: G06V20/10 , G06V20/60 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/0464
摘要: 本发明涉及一种小样本棉花害虫目标检测方法,通过对图像进行随机混合增强处理来有效增强目标其他部位特征的检测能力,提高棉花害虫的检测准确率,并通过骨干网络获得特征信息后,采用不同空洞数的空洞卷积操作获得多尺度特征图,扩大卷积运算的感受野,然后通过施加注意力机制增强局部特征的提取能力,从而能够提取图像中更多棉花害虫的特征信息,增强检测模型的泛化能力,提高小样本目标检测准确性。
-
-
-
-
-
-
-