一种基于图像和事件的多模态道路场景目标检测方法

    公开(公告)号:CN116453014A

    公开(公告)日:2023-07-18

    申请号:CN202310296018.X

    申请日:2023-03-24

    IPC分类号: G06V20/40 G06V10/40 G06V10/80

    摘要: 本发明属于计算机视觉和事件相机领域,公开了一种基于图像和事件的多模态道路场景目标检测方法。本发明引入了高效注意力机制模块,融合相邻时刻图像的信息,不仅提升了检测的精度,而且模型参数量和计算量几乎不变。采用一种轻量化的特征提取网络对事件进行特征提取,降低模型的内存大小,符合事件数据高时间分辨率的特性。为了重复利用事件数据的时序信息,本发明引入长短期记忆机制模块,通过控制内部门的状态,融合历史时刻的不同事件特征。在进行图像和事件特征融合时,采用特征融合模块,完成对两种模态数据的信息交互,提高了目标检测的准确率。

    密集行人检测方法
    12.
    发明公开

    公开(公告)号:CN114202774A

    公开(公告)日:2022-03-18

    申请号:CN202111512063.1

    申请日:2021-12-07

    摘要: 一种密集行人检测方法。在网络训练阶段,搭建卷积神经网络,训练编码器解码器及检测头部预测正确的行人包围框;并根据预测结果,为每个行人分配一个最佳的预测候选框;固定密度估计头部外的其他网络参数,使用每个行人唯一的预测候选框生成密度目标,训练密度估计头部;最后放开网络所有参数,联合训练整个网络。在测试应用阶段,在进行后处理时,每选定一个确定保留的行人框,则在这张预测密度图上减去对应位置的高斯激活图,对于那些与该被保留行人重叠率大于阈值的行人框,利用更新后的密度图对这些行人框进行二次判断。本发明在密集场景下,解决了通用的非极大值抑制方法会误删的正确预测的包围框的问题,同时也不影响非密集场景的表现。

    一种基于多尺度特征融合的行人重识别方法

    公开(公告)号:CN114202740A

    公开(公告)日:2022-03-18

    申请号:CN202111483359.5

    申请日:2021-12-07

    摘要: 一种基于多尺度特征融合的行人重识别方法,1)构建基于多尺度融合的模型,并预训练主干网络暨多尺度特征提取器。2)利用多尺度特征提取器生成图像的多尺度特征。3)采用基于Transformer的特征校准模型融合两个不同尺度的特征。4)利用深监督融合从浅层特征到深层特征不断融合不同层级的特征。5)用交叉熵损失和三元组损失监督融合过程。6)将目标测试集图像输入训练好的模型提取特征,根据特征相似度进行排序得到行人重识别的结果,进而实现行人重识别。本发明采用卷积神经网络提取多尺度特征,使用Transformer从全局的角度融合多尺度信息,使得特征同时具有细节和语义信息,有效的提高了行人重识别的准确率。

    一种基于彩色图像和深度图像的显著度检测方法

    公开(公告)号:CN114202663A

    公开(公告)日:2022-03-18

    申请号:CN202111468686.3

    申请日:2021-12-03

    摘要: 本发明属于图像显著度检测技术领域,一种基于彩色图像和深度图像的显著度检测方法。将彩色图像以及深度图像送入到双路的VGG‑16编码器进行编码,在编码过程中信息交互模块被用来传递来自于不同模态间的信息;双路VGG‑16最深的多模态特征送入跨模态互引导模块来进行更新和融合;上述编码过程获取的多水平多模态特征送入残差的多尺度聚合模块实现多水平特征残差式聚合,并且聚合后的特征采用特征金字塔网络结构实现最终的从高水平到低水平解码特征的渐进式融合,输出显著度检测结果。本发明很好的利用彩色图像以及深度图像的互补信息,能够处理在显著性检测中一直难以处理的低对比度和复杂背景的情况,并能够很好的应用于一般图像中。

    一种基于Transformer与卷积神经网络的图像修复方法

    公开(公告)号:CN115731138A

    公开(公告)日:2023-03-03

    申请号:CN202211532185.1

    申请日:2022-12-01

    摘要: 本发明属于机器学习、计算机视觉、图像修复领域,提供了一种基于Transformer模块和卷积神经网络的图像修复方法。本发明的图像修复模型使用Transformer模块与卷积神经网络相结合的混合端到端网络,对输入图像进行边缘提取获得结构先验后,得到更好的图像修复结果,再保持较高精度的同时,也保持了图像修复的速度。本发明设计了两类全新Transformer模块,分别用于对图像全局特征与局部特征的提取与处理,充分利用了图像像素与特征图的有效信息,有效的提高了图像修复的效果。同时,使用Canny算子与卷积神经网络获取图像边缘,为图像修复网络提供了一类结构先验,提升图像修复效果。

    一种基于共显著性学习的弱监督目标跟踪方法

    公开(公告)号:CN118262275B

    公开(公告)日:2024-07-23

    申请号:CN202410669172.1

    申请日:2024-05-28

    摘要: 本发明属于机器学习、计算机视觉、目标跟踪领域,公开了一种基于共显著性学习的弱监督目标跟踪方法,通过设计弱监督共显著性注意力模块,嵌入基准跟踪算法中,实现模型的弱监督训练。本发明能够使现有基准跟踪算法在降低约30倍训练标注数据的使用情况下,获得与基准跟踪算法相近或更优的性能,有效地解决了现有基准跟踪算法对大规模标注数据的依赖问题,降低了现有模型的训练成本,并缓解了现有跟踪训练数据集的迫切需求。