发明公开
- 专利标题: 一种基于扩散模型和语义引导的三维物体生成方法
-
申请号: CN202310285348.9申请日: 2023-03-22
-
公开(公告)号: CN116721200A公开(公告)日: 2023-09-08
- 发明人: 耿卫东 , 凌泽宇 , 付一童 , 厉向东 , 梁秀波
- 申请人: 浙江大学
- 申请人地址: 浙江省杭州市西湖区余杭塘路866号
- 专利权人: 浙江大学
- 当前专利权人: 浙江大学
- 当前专利权人地址: 浙江省杭州市西湖区余杭塘路866号
- 代理机构: 杭州天勤知识产权代理有限公司
- 代理商 曹兆霞
- 主分类号: G06T17/00
- IPC分类号: G06T17/00 ; G06T15/00 ; G06N3/048 ; G06N3/0464 ; G06N3/0455 ; G06N3/0475 ; G06N3/094 ; G06V10/77 ; G06V10/80 ; G06V10/82
摘要:
本发明公开了一种基于扩散模型和语义引导的三维物体生成方法,其特征在于,包括以下步骤:利用CLIP模型的文本编码器根据文本数据生成语义向量;利用条件流模型根据语义向量和第一随机噪声生成形状向量,并将该形状向量与时间步向量拼接作为引导条件;将第二随机噪声作为初始逆扩散向量,利用扩散模型基于引导条件和初始逆扩散向量经过逆扩散生成低维点云向量;利用点云解码器对低维点云向量进行解码得到高维点云,依据高维点云生成三维物体。该方法能生成更高质量的三维物体,但仍存在训练慢、推理慢、只能生成单一类别物体等缺陷。
IPC分类:
G | 物理 |
G06 | 计算;推算或计数 |
G06T | 一般的图像数据处理或产生 |
G06T17/00 | 用于计算机制图的3D建模 |