一种基于特征金字塔网络的反馈式目标检测方法

    公开(公告)号:CN111797846A

    公开(公告)日:2020-10-20

    申请号:CN201910276244.5

    申请日:2019-04-08

    申请人: 四川大学

    IPC分类号: G06K9/62

    摘要: 本发明提出了一种新颖的、稳定的单阶段目标检测方法,以提高目标检测精确度和召回率。本方法采用了残差网络和特征金字塔等目标检测技术:利用残差网络的跳跃连接不断加深目标检测模型的深度,有效提高网络的分辨能力和优化速度;利用特征金子塔网络将深层网络和浅层网络互连,使得浅层高分辨率的特征图同样包含高层级的语义信息;同时,本方法创新性的提出了一个新的关系模块,称为L2Smodule,该模块通过将顶层特征图上对大目标精确的预测结果反馈到浅层特征图上,对不同尺度的目标间的相互关系进行有效建模,从而通过相对精确的大目标的检测结果促进小目标的检测。实验结果表明本方法实现了比目前常用的顶级目标检测方法更好的检测性能。

    一种基于廉价双目相机的简易高效测距方法

    公开(公告)号:CN108413941A

    公开(公告)日:2018-08-17

    申请号:CN201810119837.6

    申请日:2018-02-06

    申请人: 四川大学

    发明人: 刘怡光 薛凯 畅青

    IPC分类号: G01C11/30 G01C11/08

    摘要: 本发明是一种基于廉价双目相机进行的简易高效测距方法。针对普通双目相机在获得图片后畸变明显情况下,提出简化矫正方法,并进行双目测距,并使用了phase correlation方法来提高匹配精度。该方法由此建立在廉价双目相机上得到了较高精度的距离测量结果。

    基于图像二维信息熵的纹理块映射到三维网格模型的方法

    公开(公告)号:CN106204710A

    公开(公告)日:2016-12-07

    申请号:CN201610546065.5

    申请日:2016-07-13

    申请人: 四川大学

    IPC分类号: G06T15/04

    CPC分类号: G06T15/04

    摘要: 本发明涉及基于图像二维信息熵的纹理块映射到三维网格模型的方法。针对三维物体重建过程中应用到的图像序列光照不一致,以及拍摄时与物体过于接近或者远离时造成的重影或者模糊现象的问题,该方法在基于传统的马尔科夫随机场能量优化解决纹理分配给三角化模型问题的同时,加入了预处理步骤解决了纹理块亮度值异常的选项,引入了图像二维信息熵,根据纹理块的内部亮度信息确定纹理块对应的数据项能量值,对三角形的顶点与边作出亮度的修改,以及对整体泊松编辑。

    用于未校准图像的高精度三维重建

    公开(公告)号:CN104778748A

    公开(公告)日:2015-07-15

    申请号:CN201510156393.X

    申请日:2015-04-03

    申请人: 四川大学

    IPC分类号: G06T17/00

    摘要: 本发明是一种用于未校准图像的高精度三维重建方法,涉及计算机视觉领域。该方法引入了匹配扩展及点云扩展算法:针对初始的匹配没有几何约束,错误较多的问题,匹配扩展算法在几何约束下,对匹配点进行扩展,获取均匀分布的、稠密的匹配信息。这些匹配信息适合于运动到结构算法,该算法可以产生图像的摄像机参数信息,同时重建出稀疏的点云。这些点云不够稠密,且精度较低,我们提出的点云扩展算法通过优化每个三维点的几何数据提高其准确性,并将每个三维点扩展到它相应的邻域内提高三维点云的稠密度。本发明针对未校准的多幅图像,进行三维重建,获得稠密且高精度的三维点云。

    基于视差图融合的三维超分辨率方法

    公开(公告)号:CN104463958A

    公开(公告)日:2015-03-25

    申请号:CN201410684093.4

    申请日:2014-11-25

    申请人: 四川大学

    发明人: 刘怡光 陈陶 李杰

    IPC分类号: G06T17/00

    CPC分类号: G06T3/4053

    摘要: 本发明是一种基于深度图融合的三维超分辨率方法,涉及计算机视觉领域。该方法引入相位相关算法:平移双目摄像机组获得同一场景的多幅深度图,利用相位相关的特性算出每幅深度图各像素与基准深度图的平移参数,根据平移参数将各深度图中的像素逐一插入到基准深度图,再由基准深度图对应摄像机参数将深度图投影到三维空间,最后得到超分辨率三维重建结果。解决双目三维重建系统在实际应用中,由于图像采集设备分辨率低、信噪比低等因素,导致三维重建结果分辨率较低的问题。

    一种基于线性关系的两步估计高精确时差定位算法

    公开(公告)号:CN104375118A

    公开(公告)日:2015-02-25

    申请号:CN201410636004.9

    申请日:2014-11-13

    申请人: 四川大学

    发明人: 刘怡光 曹丽萍

    IPC分类号: G01S5/00

    CPC分类号: G01S5/00

    摘要: 基于我们申请并已公布的专利201110197395.5(一种基于线性关系的高精确时差定位算法),本发明进一步公开了一种基于线性关系的两步估计高精确时差定位算法。首先利用已公布专利201110197395.5中的方法完成辐射源位置的初步估计。在关键的第二步估计中,基于第一步估计得到的辐射源位置得到另一线性方程组,该方程组以辐射源位置修正量为变量。基于最小均方原则,第二步估计得到辐射源位置修正量。综合两步估计结果,得到辐射源位置最终估计值。由于两步估计中皆用线性关系,所得解唯一。通过第二步估计技术对已公布专利201110197395.5所得结果进行修正,本发明方法大幅度提高了估计精度和鲁棒性。

    基于改进的YOLOv5的无人机捕获场景目标检测方法

    公开(公告)号:CN117710837A

    公开(公告)日:2024-03-15

    申请号:CN202311250811.2

    申请日:2023-09-26

    申请人: 四川大学

    摘要: 本发明公开了一种基于改进的YOLOv5的无人机捕获场景目标检测方法,该发明可以在保证精确度和完整度的情况下,高效地对无人机捕获图像的小目标进行定位和分类。对于无人机捕获的图像存在更多分布密集和遮挡的小目标导致的检测效果受限的问题,本文引入了混合Transformer模块改进检测头;针对无人机图像中目标的特点,注意力模块采用CBAM进行自适应特征细化;并且在特征融合结构中引入CBAM模块提高小目标的特征融合效率;再将改进的特征融合结构与Transformer结构相融合,让模型具有更好的特征融合能力,减少小目标特征的损失。

    一种提取图像中非连续直线的方法

    公开(公告)号:CN111932506B

    公开(公告)日:2023-07-14

    申请号:CN202010713335.3

    申请日:2020-07-22

    申请人: 四川大学

    摘要: 本发明是一种提取图像中非连续直线的方法,涉及图像处理中非连续直线的提取,属于计算机视觉与图像处理领域。该方法针对图像中的非连续直线,利用了基于形态学处理的Steger中心线提取算法和结合曲线切割的RANSAC拟合算法的非连续直线提取方法。首先通过基于图像形态学处理的Steger算法实现非连续直线的连接及中心线提取,得到拟合直线所需的预备点集;再使用曲线切割算法将交叉曲线进行切割,去除交叉曲线对拟合结果的影响;最后利用RANSAC算法进行线性拟合得到最终提取结果。该方法解决了图像中非连续直线不能通过相邻像素点获取直线信息的问题;实现了非连续直线的连接及提取;可以应用于金属内部的缺陷检测,自然灾害影响判断,生物图像观察等方面。

    基于GPU的大型场景三维稠密重建方法

    公开(公告)号:CN114820916B

    公开(公告)日:2023-05-23

    申请号:CN202110093576.7

    申请日:2021-01-22

    申请人: 四川大学

    IPC分类号: G06T17/00 G06T7/593 G06F17/11

    摘要: 本发明是一种基于GPU的大型场景三维稠密重建方法,属于计算机三维立体视觉领域。本发明通过利用局部相关性与熵,为二维图像中的不同像素自动分配合适的匹配窗口大小,以改善对弱纹理区域与随机纹理区域的重建效果;同时使用了兼顾重叠区域与相机参数的临近图像选取策略,为每幅图像选取合适数量的临近图像进行立体匹配;此外本发明在立体匹配中使用自适应多图匹配度集成损失方程来合理使用匹配冗余信息;通过采取以上策略,本发明让重建模型有着较高的精确度与完整度。本发明可在图形处理器(GPU)上并行部署,可实现对大规模场景的高质量快速重建。

    一种面向空基平台的目标追踪三维数字仿真系统

    公开(公告)号:CN112016182B

    公开(公告)日:2023-03-24

    申请号:CN201910461136.5

    申请日:2019-05-30

    申请人: 四川大学

    IPC分类号: G06F30/20

    摘要: 本发明涉及一种面向空基平台的目标追踪三维数字仿真系统。该系统通过数据输入接口实时接受空基平台传入的数据,并用以计算空基平台与动、静态两种目标的坐标、状态等信息。并以三维仿真模拟的方式还原真实场景中目标发现和追踪过程。整个系统包括交互界面、实时空基平台数据读取模块、物理参数计算模块、物理属性模拟模块、模拟仿真模型模块几个部分,在呈现追踪效果上避免了真实环境下的气流扰动影响,能够精准、清晰、实时地演示空基平台目标追踪过程。