一种基于扩散模型和语义引导的三维物体生成方法

Invention Publication

CN116721200A 一种基于扩散模型和语义引导的三维物体生成方法审中-实审

Please log in to see more content

Patent Title: 一种基于扩散模型和语义引导的三维物体生成方法
Application No.: CN202310285348.9

Application Date: 2023-03-22
Publication No.: CN116721200A

Publication Date: 2023-09-08
Inventor: 耿卫东 , 凌泽宇 , 付一童 , 厉向东 , 梁秀波
Applicant: 浙江大学
Applicant Address: 浙江省杭州市西湖区余杭塘路866号
Assignee: 浙江大学
Current Assignee: 浙江大学
Current Assignee Address: 浙江省杭州市西湖区余杭塘路866号
Agency: 杭州天勤知识产权代理有限公司
Agent 曹兆霞
Main IPC: G06T17/00
IPC: G06T17/00 ; G06T15/00 ; G06N3/048 ; G06N3/0464 ; G06N3/0455 ; G06N3/0475 ; G06N3/094 ; G06V10/77 ; G06V10/80 ; G06V10/82

Abstract:

本发明公开了一种基于扩散模型和语义引导的三维物体生成方法，其特征在于，包括以下步骤：利用CLIP模型的文本编码器根据文本数据生成语义向量；利用条件流模型根据语义向量和第一随机噪声生成形状向量，并将该形状向量与时间步向量拼接作为引导条件；将第二随机噪声作为初始逆扩散向量，利用扩散模型基于引导条件和初始逆扩散向量经过逆扩散生成低维点云向量；利用点云解码器对低维点云向量进行解码得到高维点云，依据高维点云生成三维物体。该方法能生成更高质量的三维物体，但仍存在训练慢、推理慢、只能生成单一类别物体等缺陷。

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06T	一般的图像数据处理或产生
G06T17/00	用于计算机制图的3D建模