Patent search ap:("鹏城实验室") AND inv:"胡凯" Page 1

1.

发明公开
基于大语言模型的语义三维场景理解方法、装置、设备及存储介质审中-实审

公开(公告)号：CN119941989A

公开(公告)日：2025-05-06

申请号：CN202510009870.3

申请日：2025-01-03

Applicant: 鹏城实验室

Inventor： 刘凯 , 姜军 , 裴海龙 , 罗明成 , 胡凯 , 马健 , 李萌 , 邹龙昊 , 李伟超 , 陶小峰

IPC: G06T17/00 , G06T19/20 , G06V10/26 , G06V10/40 , G06V10/24 , G06V10/75 , G06T15/00

Abstract: 本发明公开了一种基于大语言模型的语义三维场景理解方法、装置、设备及存储介质，该方法包括：采集室内场景的多角度图片，并对多角度图片进行处理，获得多角度图片对应的三维高斯椭球和图像语义文本；将图像语义文本输入至预设大语言模型进行常识性训练，并基于训练结果预测室内场景类型获得对应的高级语义；将图像语义文本和高级语义压缩后嵌入三维高斯椭球，获得目标三维高斯椭球；基于目标三维高斯椭球，通过可微分渲染端到端训练对室内场景对应的3D模型进行参数优化，形成嵌入语义信息的3D场景表示，以构建从局部物体到全局场景的深层次场景理解，相比于现有技术，本发明有效提升了机器人系统在复杂环境中的场景理解和交互能力。

Patent Agency Ranking