基于扩散模型的三维点云目标检测方法与装置

    公开(公告)号:CN116863426A

    公开(公告)日:2023-10-10

    申请号:CN202310843628.7

    申请日:2023-07-10

    摘要: 本发明涉及一种基于扩散模型的三维点云目标检测方法:获取点云数据并进行体素化和数据增强;将体素化后的数据送入体素编码器,转换为稠密鸟瞰图视角的二维稠密特征;在鸟瞰图视角下的标注框送入基于扩散模型的候选框生成器中返回产生的噪声框和时间步水平;在二维特征上裁剪对应特征并送入检测解码器进行预测;优化损失函数,进行迭代训练直至模型收敛;利用训练好的模型进行三维目标检测。本发明通过利用扩散模型生成候选框,在推理时能直接使用从高斯分布中采用的随机框作为候选,避免手工经验式设计锚框尺寸,让检测解码器更加鲁棒,能够适应不同噪声水平的输入并得到检测结果。本发明还提供了相应的基于扩散模型的三维点云目标检测装置。

    一种无监督人群计数方法、装置及存储介质

    公开(公告)号:CN116363595A

    公开(公告)日:2023-06-30

    申请号:CN202310387316.X

    申请日:2023-04-07

    摘要: 本发明公开了一种无监督人群计数方法、装置及存储介质,方法包括将第一输入图像裁剪为图像块,并获取图像块的粗粒度文本;将图像块输入第一图像编码器,将粗粒度文本输入第一文本编码器,生成第一相似度矩阵,根据第一相似度矩阵和第一区分度类别相似度,筛选出第一目标类别的图像块;获取第二目标类别的图像块的细粒度文本,并输入第二文本编码器,生成第二相似度矩阵,并根据第二相似度矩阵和第二区分度类别相似度,筛选出第二目标类别的图像块,并输入第二图像编码器,将计数文本输入第三文本编码器,生成目标相似矩阵,根据目标相似矩阵和计数文本的相似度,获取图像的人群数量。本发明不需要任何人工标签,极大减少了标注成本。

    一种基于多尺度自适应随机森林的激光雷达检测人腿方法

    公开(公告)号:CN111444769B

    公开(公告)日:2022-07-01

    申请号:CN202010116963.3

    申请日:2020-02-25

    发明人: 周瑜 白翔

    摘要: 本发明公开了一种基于多尺度自适应随机森林的激光雷达检测人腿方法,用于从2D激光雷达点云中检测出行人腿部。与传统的检测人腿的方法不同,该方法能够鲁棒地处理由于2D激光雷达数据的不稳定导致分类器检测能力下降的问题,同时也能够处理2D激光雷达数据的多尺度特性对检测的影响。首先,通过聚类算法将2D激光雷达点云聚类成多个点簇;其次,从每一个点簇中提取多维特征构成特征向量;进一步,将该特征向量输入分类器,分类器输出该点簇是人腿的置信度。该方法是针对2D激光雷达下进行人腿检测任务所提出的一种新颖的检测方法,其实现简单,易于扩展,具有较高的计算效率和检测准确度,能够部署在低成本机器人上,具有很强的实际应用价值。

    一种基于激光雷达的行人检测和追踪方法

    公开(公告)号:CN111444767B

    公开(公告)日:2022-06-21

    申请号:CN202010116935.1

    申请日:2020-02-25

    发明人: 周瑜 白翔

    摘要: 本发明公开了一种基于激光雷达的行人检测和追踪方法,用于从2D激光雷达点云中检测出行人并对其进行连续的追踪。与传统的行人检测和追踪的方法不同,该方法更加鲁棒的处理由于2D激光雷达数据的不稳定性及多尺度特性对检测的影响。首先,本方法利用了一种多尺度自适应随机森林分类器算法将人腿从激光雷达点云中准确且高效的检测出来;其次,该方法引入局部栅格地图来排除静态近似人腿的障碍物对行人检测的影响;进一步,通过Tracking‑by‑Detection策略,从检测的人腿中检测行人,同时建立行人的匀速运动模型;最后,利用卡尔曼滤波器对行人进行追踪,追踪的同时判断行人下一时刻的位置与下一时刻检测的人腿进行数据关联,以对下一时刻的行人进行快速检测与追踪。

    一种基于尺度上下文回归的目标追踪与跟随方法

    公开(公告)号:CN111445497A

    公开(公告)日:2020-07-24

    申请号:CN202010117523.X

    申请日:2020-02-25

    IPC分类号: G06T7/223

    摘要: 本发明公开了一种基于尺度上下文回归的目标追踪与跟随方法,包括:通过单目摄像机采集图片,用户通过在待跟随目标上设置一个标识物体所在图像区域的矩形包围盒来初始化追踪过程;使用尺度上下文回归模型进行目标追踪,获取目标位置和尺度;使用基于局部块的追踪目标质量评估方法,判断是否发生目标丢失并及时的进行重检测;建立跟随者自身与待跟随目标的相对位置关系,同时基于此相对位置关系调整跟随者自身位姿。本发明在目标跟随过程中,增强系统判别与待跟随目标具有相似语义干扰物的能力,通过后处理使系统能够判断目标是否丢失并及时进行重检测,建立自身与目标的相对位置关系,最后调整自身位姿进行跟随。

    一种用于反光地面场景的微小障碍物发现方法

    公开(公告)号:CN111444768A

    公开(公告)日:2020-07-24

    申请号:CN202010116956.3

    申请日:2020-02-25

    发明人: 周瑜 白翔

    摘要: 本发明公开了一种用于反光地面场景的微小障碍物发现方法,包括:对反光地面场景的小障碍物数据集进行障碍物及地面的实例级标注,得到带标注的标准训练数据集;训练基于几何线索和表观线索融合的障碍物发现模型,从图像中提取区域级的几何特征及区域级的表观特征,并根据带标注的标准训练数据集,采用随机森林作为学习器,学习到每一个图像区域存在障碍物的概率,得到基于几何线索和表观线索融合的障碍物发现模型;利用上述训练好的模型对机器人视角的场景图片进行障碍物发现。本发明利用机器人的位姿信息,并构建了区域级的几何特征,可以表达单张图片中无法体现出的空间几何特征。相比于现有技术可以极大减小地面上的障碍物误检测。

    一种基于激光雷达的行人检测和追踪方法

    公开(公告)号:CN111444767A

    公开(公告)日:2020-07-24

    申请号:CN202010116935.1

    申请日:2020-02-25

    发明人: 周瑜 白翔

    摘要: 本发明公开了一种基于激光雷达的行人检测和追踪方法,用于从2D激光雷达点云中检测出行人并对其进行连续的追踪。与传统的行人检测和追踪的方法不同,该方法更加鲁棒的处理由于2D激光雷达数据的不稳定性及多尺度特性对检测的影响。首先,本方法利用了一种多尺度自适应随机森林分类器算法将人腿从激光雷达点云中准确且高效的检测出来;其次,该方法引入局部栅格地图来排除静态近似人腿的障碍物对行人检测的影响;进一步,通过Tracking-by-Detection策略,从检测的人腿中检测行人,同时建立行人的匀速运动模型;最后,利用卡尔曼滤波器对行人进行追踪,追踪的同时判断行人下一时刻的位置与下一时刻检测的人腿进行数据关联,以对下一时刻的行人进行快速检测与追踪。

    文本行的定位方法及装置
    80.
    发明授权

    公开(公告)号:CN106156711B

    公开(公告)日:2020-06-30

    申请号:CN201510190211.0

    申请日:2015-04-21

    IPC分类号: G06K9/00 G06K9/46

    摘要: 本发明公开一种文本行的定位方法及装置,属于计算机视觉技术领域。该方法包括:提取待检测图像中各个像素的至少包括对称性特征向量的特征向量;根据每个像素的特征向量,确定多个潜在位于文本行对称轴上的目标像素,位于文本行对称轴上的像素具有对称性;对各个目标像素进行聚合,得到多个候选文本行区域;滤除非文本行区域得到文本行区域。由于待检测图像中的文本行区域通常具有对称性,因此,基于提取待检测图像中每个像素的对称性特征向量,能够从自然图像中直接定位到待检测图像中的文本行区域,而无需对各个候选字符区域进行组合以得到文本行区域,不仅方式简单,而且不依赖于自然图像中的连通区域,扩大了文本行定位方式的适用范围。