-
公开(公告)号:CN117095132A
公开(公告)日:2023-11-21
申请号:CN202311346203.1
申请日:2023-10-18
申请人: 北京渲光科技有限公司
发明人: 方顺 , 穆子杰 , 冯星 , 崔铭 , 张志恒 , 赵炜阳 , 裴瑶 , 杨子剑 , 徐杰 , 张晓龙 , 吕艳娜 , 张玉奇 , 丁晓彤 , 廖晨涵 , 林俊杰 , 刘昊卿 , 张柏鹏 , 卢文坤 , 罗文锋 , 马忠莉
IPC分类号: G06T17/00 , G06T3/00 , G06T7/73 , G06V10/82 , G06V10/80 , G06V10/56 , G06V10/774 , G06N3/0464 , G06N3/0455 , G06N3/084
摘要: 本发明属于计算机视觉领域,具体涉及了一种基于隐式函数的三维重建方法和系统,旨在解决技术重建三维模型流程复杂、门槛高、效率低、速度慢的问题。本发明包括:将待建模图像,分别通过粗粒度特征提取单元和细粒度特征提取单元分别获取粗粒度特征和细粒度特征并都赋予对应的深度信息;最后通过多层感知机将粗粒度特征和细粒度特征进行特征拼接和预测,获得每个三维空间点在3D重建模型表面内的概率和颜色,确定3D重建模型。本发明使每个像素都包括整张图像的像素信息,实现了单视图的三维重建,并且简化了流程和降低了技术门槛,同时还提高了重建效率和速度,实现了像素级三维重建,提高了三维重建模型的精度,并且支持多种数据源。
-
公开(公告)号:CN117173315A
公开(公告)日:2023-12-05
申请号:CN202311452552.1
申请日:2023-11-03
申请人: 北京渲光科技有限公司
发明人: 方顺 , 杨峰峰 , 崔铭 , 冯星 , 张志恒 , 韦建伟 , 张造时 , 王月 , 乔磊 , 孙思远 , 裴瑶 , 张柏鹏 , 高鹏蕊 , 吕艳娜 , 贺斌 , 周昊 , 闫茹愉 , 王朝鹏 , 杨子剑 , 徐杰
摘要: 本发明属于人工智能、计算机视觉、计算机图形学领域,具体涉及一种基于神经辐射场的无界场景实时渲染方法、系统及设备,旨在解决现有NeRF方法的特征分配存在浪费、模型训练时间长、仅能处理有界场景的渲染以及存在控制流分歧的问题。本发明方法包括:采集无边场景中任意但已知位姿的图像,作为输入图像;对输入图像中点进行标准化,标准化后,结合预构建的哈希索引表,进行位置编码;将位置编码后的特征向量输入预构建的属性预测网络,得到输入图像中的点的体密度及RGB颜色,进而得到新视角渲染后的图像。本发明大大减少了内存消耗,缩减了模型的训练时长、通过神经网络学习哈希值处理避免控制流分歧并实现了无界场景的渲染。
-
公开(公告)号:CN117095132B
公开(公告)日:2024-02-20
申请号:CN202311346203.1
申请日:2023-10-18
申请人: 北京渲光科技有限公司
发明人: 方顺 , 穆子杰 , 冯星 , 崔铭 , 张志恒 , 赵炜阳 , 裴瑶 , 杨子剑 , 徐杰 , 张晓龙 , 吕艳娜 , 张玉奇 , 丁晓彤 , 廖晨涵 , 林俊杰 , 刘昊卿 , 张柏鹏 , 卢文坤 , 罗文锋 , 马忠莉
IPC分类号: G06T17/00 , G06T3/08 , G06T7/73 , G06V10/82 , G06V10/80 , G06V10/56 , G06V10/774 , G06N3/0464 , G06N3/0455 , G06N3/084
摘要: 提高了重建效率和速度,实现了像素级三维重本发明属于计算机视觉领域,具体涉及了一 建,提高了三维重建模型的精度,并且支持多种种基于隐式函数的三维重建方法和系统,旨在解 数据源。决技术重建三维模型流程复杂、门槛高、效率低、速度慢的问题。本发明包括:将待建模图像,分别通过粗粒度特征提取单元和细粒度特征提取单元分别获取粗粒度特征和细粒度特征并都赋予对应的深度信息;最后通过多层感知机将粗粒度特征和细粒度特征进行特征拼接和预测,获得每个三维空间点在3D重建模型表面内的概率和颜色,确定3D重建模型。本发明使每个像素都包括
-
公开(公告)号:CN117351157A
公开(公告)日:2024-01-05
申请号:CN202311651504.5
申请日:2023-12-05
申请人: 北京渲光科技有限公司
IPC分类号: G06T17/00 , G06T7/73 , G06N3/0464 , G06N3/08
摘要: 本发明属于3D场景重建领域,具体涉及了一种基于单视图三维场景位姿估计方法、系统及设备,旨在解决现有技术无法仅根据一张图像对包含多个对象的复杂场景进行精确三维重建和位姿估计的问题。本发明包括:获取待处理图片;对待处理图片进行2D目标检测,获得所有目标的2D包围盒图片;基于待处理图片和所有目标的2D包围盒图片,通过基于神经网络的六路径3D包围盒构建网络,获取3D包围盒。本发明通过采用6个网络从不同的维度对3D对象的姿态进行估计,实现了仅通过单视图对场景及场景中的目标的位姿准确估计和三维重建,并分别设置5个损失函数对网络进行训练,最终获得的模型能够实现三维场景及场景中对象的自动重建,提高了模型重建的效率。
-
公开(公告)号:CN117351157B
公开(公告)日:2024-02-13
申请号:CN202311651504.5
申请日:2023-12-05
申请人: 北京渲光科技有限公司
IPC分类号: G06T17/00 , G06T7/73 , G06N3/0464 , G06N3/08
摘要: 本发明属于3D场景重建领域,具体涉及了一种基于单视图三维场景位姿估计方法、系统及设备,旨在解决现有技术无法仅根据一张图像对包含多个对象的复杂场景进行精确三维重建和位姿估计的问题。本发明包括:获取待处理图片;对待处理图片进行2D目标检测,获得所有目标的2D包围盒图片;基于待处理图片和所有目标的2D包围盒图片,通过基于神经网络的六路径3D包围盒构建网络,获取3D包围盒。本发明通过采用6个网络从不同的维度对3D对象的姿态进行估计,实现了仅通过单视图对场景及场景中的目标的位姿准确估计和三维重建,并分别设置5个损失函数对网络进行训练,最终获得的模型能够实现三维场景及场景中对象的自动重建,提高了模型重建的效率。
-
-
-
-