-
公开(公告)号:CN117726949A
公开(公告)日:2024-03-19
申请号:CN202311188848.7
申请日:2023-09-14
申请人: 安徽大学
IPC分类号: G06V20/13 , G06V10/25 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/08
摘要: 本发明提供基于场景信息解耦引导的极小物体检测方法及系统,方法包括获取大规模高空遥感卫星图像解耦的场景上下文信息;将解耦后的特征图送入前景增强模块中,以产生增强前景特征图;将获取的前景特征图与主干网络提取的特征图送入场景信息融合模块;通过对融合的特征图进行上采样,得到对极小目标的检测。本发明解决了在大规模高空遥感卫星图中对于密集极小目标的场景下,存在的误检率高、目标分类错误和运动轨迹偏差的技术问题。
-
公开(公告)号:CN118469022B
公开(公告)日:2024-10-29
申请号:CN202410919970.5
申请日:2024-07-10
申请人: 安徽大学
IPC分类号: G06N5/04 , G06N3/0455 , G06N3/0499 , G06F18/25 , G06V10/40 , G06V10/56 , G06V10/58 , G06F40/30 , G06V10/80 , G06V10/82 , G06N3/048
摘要: 本发明公开了基于文本信息引导的多源遥感视觉问答方法及系统,方法包括:获得RGB特征、SAR特征以及原始文本特征;原始文本特征和RGB特征输入第一特征增强模型得到RGB增强特征,原始文本特征和SAR特征输入第二特征增强模型得到SAR增强特征;RGB增强特征、SAR增强特征以及原始文本特征均输入QGF模型得到图像融合特征;图像融合特征以及原始文本特征输入第一解码器得到融合文本特征的图像特征,将原始文本特征以及图像融合特征输入第二解码器得到融合图像特征的文本特征,经处理得到最终预测的遥感视觉问答任务答案;本发明的优点在于:提高遥感视觉问答任务回答的准确性。
-
公开(公告)号:CN117496459A
公开(公告)日:2024-02-02
申请号:CN202311512570.4
申请日:2023-11-10
申请人: 安徽大学
IPC分类号: G06V20/54 , G06V20/40 , G06V10/44 , G06V10/62 , G06V10/764 , G06V20/17 , G06V10/26 , G06V10/25
摘要: 本发明提供基于CRNet的无人机视频车辆检测方法及系统,方法包括:采集得到差异场景视频数据,据以构建无人机视频时序序列;对差异场景视频数据,进行类别标注操作,以得到车辆类别标注数据;基于CRNet,将无人机视频时序序列作为模型输入数据,设置模型骨干网络时序增强模块,据以构建车辆检测识别模型;根据车辆检测识别模型,求取box损失、角度损失,以求取回归损失及分类损失,据以处理得到整体损失。本发明解决了难以排除运动模糊、随机遮挡以及密集分布的不利影响,以及对细粒度目标分类能力差的技术问题。
-
公开(公告)号:CN117173023A
公开(公告)日:2023-12-05
申请号:CN202311205827.1
申请日:2023-09-18
申请人: 安徽大学
IPC分类号: G06T3/40 , G06T5/50 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明提供无人机高分辨率热红外图像生成方法及系统,方法包括:对无人机捕获的热图像和可见光图像进行不同类型的浅层特征提取,得到两种模态的浅层特征;构建并利用相互指导模块MGM,将可见和热成像特征分别输入到MGM的两个不同分支中,以提取两个子任务的深层特征,通过双向注意力传递机制,使两个任务之间进行全面的特征交互,得到高质量的模态转换和超分辨率特征;构建并利用双向对齐融合模块BAFM,同时将两个分支的输出精细对齐到相同的特征空间,并进行特征融合;融合的特征通过pixelshuffle上采样得到超分辨率结果。本发明解决了由于可见图像和热红外图像信息利用不充分、不同模态之间存在差异导致无人机热红外图像质量较低的技术问题。
-
公开(公告)号:CN116523753A
公开(公告)日:2023-08-01
申请号:CN202310511388.0
申请日:2023-05-06
申请人: 安徽大学
摘要: 本发明提供多线索引导的无人机热红外图像超分辨率重建方法及系统,方法包括:提取可见光图像及热红外图像中的线索特征;将已得到的线索送入多线索引导模块中,以产生不同的特征;三种线索送入渐进式融合模块进行融合;通过对融合的特征图进行上采样,得到高分辨率无人机热红外图像。本发明解决了大规模图像超分辨率重建的场景下纹理信息恢复困难、图像纹理恢复错误、纹理恢复真实性低、恢复细节较少的技术问题。
-
公开(公告)号:CN118941914A
公开(公告)日:2024-11-12
申请号:CN202410861508.4
申请日:2024-06-28
申请人: 安徽大学
IPC分类号: G06V10/82 , G06V10/20 , G06V10/40 , G06V10/766 , G06V10/25 , G06V10/764 , G06N3/0464 , G06N3/084 , G06N3/09
摘要: 本发明提供结构信息引导的SAR目标细粒度识别方法及系统,方法包括:采用了YOLOv5的策略进行数据预处理;将预处理后的数据送入DCN和注意力模块中,对图像中的关键特征进行引导增强;特征送入检测头,生成最终的识别结果;采用Focaler‑SloU进行网络训练。本发明解决了鲁棒性和泛化性较弱、虚警率高、漏检错检以及目标具体型号难以进行准确的细粒度分类的技术问题。
-
公开(公告)号:CN118469022A
公开(公告)日:2024-08-09
申请号:CN202410919970.5
申请日:2024-07-10
申请人: 安徽大学
IPC分类号: G06N5/04 , G06N3/0455 , G06N3/0499 , G06F18/25 , G06V10/40 , G06V10/56 , G06V10/58 , G06F40/30 , G06V10/80 , G06V10/82 , G06N3/048
摘要: 本发明公开了基于文本信息引导的多源遥感视觉问答方法及系统,方法包括:获得RGB特征、SAR特征以及原始文本特征;原始文本特征和RGB特征输入第一特征增强模型得到RGB增强特征,原始文本特征和SAR特征输入第二特征增强模型得到SAR增强特征;RGB增强特征、SAR增强特征以及原始文本特征均输入QGF模型得到图像融合特征;图像融合特征以及原始文本特征输入第一解码器得到融合文本特征的图像特征,将原始文本特征以及图像融合特征输入第二解码器得到融合图像特征的文本特征,经处理得到最终预测的遥感视觉问答任务答案;本发明的优点在于:提高遥感视觉问答任务回答的准确性。
-
公开(公告)号:CN118429622A
公开(公告)日:2024-08-02
申请号:CN202410611543.0
申请日:2024-05-16
申请人: 安徽大学
IPC分类号: G06V10/25 , G06V20/40 , G06V10/40 , G06V20/70 , G06V10/52 , G06V10/80 , G06V10/82 , G06V10/26 , G06V20/17 , G06N3/0499 , G06N3/048 , G06N3/0464 , G06N3/045
摘要: 本发明公开了基于河流信息引导的污染物高精度目标检测方法及系统,方法包括:提取含有污染问题的河流视频区段,提取视频帧;将视频帧输入SAM模型的图片编码器得到图像特征嵌入,将文本描述输入Grounding DINO模型,Grounding DINO模型的输出结果输入到SAM模型的提示编码器得到提示特征嵌入;将图像特征嵌入以及提示特征嵌入均输入区域解耦模块得到先验增强特征;将视频帧输入检测器骨干网络获得多尺度特征;将先验增强特征与多尺度特征分别采用FFM模块进行融合得到多尺度融合特征;将多尺度融合特征均输入检测头,对污染物进行识别;本发明的优点在于:减少人力物力,且检测精度高。
-
-
-
-
-
-
-