-
公开(公告)号:CN117612056A
公开(公告)日:2024-02-27
申请号:CN202311407926.8
申请日:2023-10-27
Applicant: 华南农业大学
Abstract: 本发明公开了一种基于语义理解与自身感知的视频目标分割方法及装置,方法包括:采用预设的编码器提取视频当前帧的图像,获取浅层特征与深层特征;对深层特征与特征记忆建立密集匹配关系,然后使用自感知关系增强特征,经过特征融合后获取融合的特征匹配结果;对深层特征经过密集匹配后形成语义关系,获取深层语义输出序列;使用语义解码器对浅层特征和深层语义输出序列进行融合并解码,获取多尺度语义特征;最后将融合的特征匹配结果、多尺度语义特征和浅层特征输入到分割解码器,获取分割结果。本发明提升复杂场景特别是外观变化较大场景下的目标分割表现,同时能够真实地还原出目标的边缘细节,提升分割掩码边界的精确度。
-
公开(公告)号:CN119516249A
公开(公告)日:2025-02-25
申请号:CN202411464089.7
申请日:2024-10-21
Applicant: 华南农业大学
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06V10/774 , G06V10/776 , G06V10/40 , G06V10/30 , G06V10/75 , G06T7/00
Abstract: 本发明公开了一种基于变分自编码器与去噪网络的多类别缺陷检测方法及装置,方法包括:获取工业产品表面缺陷图像并进行预处理,构建训练集和验证集;方法的训练过程分为两个阶段:第一阶段,将预处理后的训练图像输入变分自编码器进行训练,学习图像的特征分布,并通过重建图像来捕捉正常图像的特征。第二阶段,利用去噪网络与特征引导模块在变分自编码器的特征空间中对图像特征进行二次重建,从而增强模型的重建能力和多类别重建能力;在推理阶段,通过特征提取器提取原始图像与重建图像的多尺度特征,进行特征比对,生成异常评分图。本发明在增强变分自编码器重建能力的同时保留正常信息,有效减少重建失败而导致的缺陷漏检。
-
公开(公告)号:CN117541784A
公开(公告)日:2024-02-09
申请号:CN202311279962.0
申请日:2023-10-07
Applicant: 华南农业大学
IPC: G06V10/26 , G06V10/42 , G06V10/774 , G06V10/82 , G06V10/764 , G06V20/40
Abstract: 本发明公开了一种基于高斯注意力和自适应聚焦的单目标跟踪方法及装置,方法包括:对数据集进行裁剪操作并生成训练集;提取训练集的搜索图像特征和模板图像特征;构建并利用训练集训练高斯Transformer,具体地,从搜索图像特征中建立稀疏注意力,获取搜索图像中最相关的区域,然后利用高斯注意力增强模板图像特征,获得模板图像中核心的特征信息,最后利用自适应聚焦模块进行特征的目标聚焦;最终,利用双头预测器实现单目标跟踪。本发明利用高斯注意力解决了自注意力捕捉图像中元素位置关系的问题,同时在自适应聚焦模块中引入前一帧中目标的形状和位置信息,增加目标与相似物体的对比度,使目标特征更加突出,以实现鲁棒且精准的目标跟踪。
-
-