一种文本引导的神经辐射场建筑物场景风格化方法

    公开(公告)号:CN117541732A

    公开(公告)日:2024-02-09

    申请号:CN202410028439.9

    申请日:2024-01-09

    摘要: 本发明公开了一种文本引导的神经辐射场建筑物场景风格化方法,包括训练得到一建筑场景几何外观重建模型M1,用于生成内容图像;训练得到一风格化内容图像生成模型M2,用于得到风格化内容图像;用M1、M2构建一整体模型,训练得到融合模型,用户根据需求向融合模型输入一文本信息和一视角,融合模型输出该视角下的风格化内容图像。本发明在构造M1时构造一基于体素网格特征的NeRF模型,能优化NeRF网络结构,提高渲染速度,在构造M2时设计了SCYUVNet模型,能高效地产生高质量的风格转换结果。并克服了现有技术中,2D图片缺乏空间一致性约束和对3D场景多维度特征感知从而影响风格迁移效果的缺陷,使最终图像具有多视角下的空间一致性。