单视图三维场景位姿估计方法、系统及设备

    公开(公告)号:CN117351157A

    公开(公告)日:2024-01-05

    申请号:CN202311651504.5

    申请日:2023-12-05

    摘要: 本发明属于3D场景重建领域,具体涉及了一种基于单视图三维场景位姿估计方法、系统及设备,旨在解决现有技术无法仅根据一张图像对包含多个对象的复杂场景进行精确三维重建和位姿估计的问题。本发明包括:获取待处理图片;对待处理图片进行2D目标检测,获得所有目标的2D包围盒图片;基于待处理图片和所有目标的2D包围盒图片,通过基于神经网络的六路径3D包围盒构建网络,获取3D包围盒。本发明通过采用6个网络从不同的维度对3D对象的姿态进行估计,实现了仅通过单视图对场景及场景中的目标的位姿准确估计和三维重建,并分别设置5个损失函数对网络进行训练,最终获得的模型能够实现三维场景及场景中对象的自动重建,提高了模型重建的效率。

    单视图三维场景位姿估计方法、系统及设备

    公开(公告)号:CN117351157B

    公开(公告)日:2024-02-13

    申请号:CN202311651504.5

    申请日:2023-12-05

    摘要: 本发明属于3D场景重建领域,具体涉及了一种基于单视图三维场景位姿估计方法、系统及设备,旨在解决现有技术无法仅根据一张图像对包含多个对象的复杂场景进行精确三维重建和位姿估计的问题。本发明包括:获取待处理图片;对待处理图片进行2D目标检测,获得所有目标的2D包围盒图片;基于待处理图片和所有目标的2D包围盒图片,通过基于神经网络的六路径3D包围盒构建网络,获取3D包围盒。本发明通过采用6个网络从不同的维度对3D对象的姿态进行估计,实现了仅通过单视图对场景及场景中的目标的位姿准确估计和三维重建,并分别设置5个损失函数对网络进行训练,最终获得的模型能够实现三维场景及场景中对象的自动重建,提高了模型重建的效率。