一种基于扩散模型和语义引导的三维物体生成方法
摘要:
本发明公开了一种基于扩散模型和语义引导的三维物体生成方法,其特征在于,包括以下步骤:利用CLIP模型的文本编码器根据文本数据生成语义向量;利用条件流模型根据语义向量和第一随机噪声生成形状向量,并将该形状向量与时间步向量拼接作为引导条件;将第二随机噪声作为初始逆扩散向量,利用扩散模型基于引导条件和初始逆扩散向量经过逆扩散生成低维点云向量;利用点云解码器对低维点云向量进行解码得到高维点云,依据高维点云生成三维物体。该方法能生成更高质量的三维物体,但仍存在训练慢、推理慢、只能生成单一类别物体等缺陷。
0/0