-
公开(公告)号:CN117115804A
公开(公告)日:2023-11-24
申请号:CN202311078304.5
申请日:2023-08-23
申请人: 华中科技大学
IPC分类号: G06V20/64 , G06V20/70 , G06V10/25 , G06V10/764 , G06V10/774 , G06V10/766 , G06V10/82 , G06N3/0455 , G06N3/0895
摘要: 本发明涉及一种基于视觉Transformer的弱‑半监督三维点云目标检测方法:获取数据集的物体级标注数据,并在标注框内选取伪标注点;训练一个点到框的转换器,将点云场景和所选取的伪标注点编码为tokens,使用一个视觉Transformer的编码器将场景tokens和标注tokens进行交互,训练并优化生成伪标注框的质量;获取点级别标注数据,使用上一步骤训练的视觉Transformer推理并得到伪标注框数据;在物体级标注和由点级标注生成的伪标注框上训练已有的室外或室内三维点云目标检测方法;利用训练好的模型进行三维目标检测。本发明通过减少数据集的标注量,只标注少量物体级标注和剩余点级别标注,得到与100%全标注数据相近的性能。本发明还提供相应的基于视觉Transformer的弱‑半监督三维点云目标检测装置。