三维模型的重建方法、装置、设备及存储介质

    公开(公告)号:CN117218278A

    公开(公告)日:2023-12-12

    申请号:CN202310315796.9

    申请日:2023-03-16

    摘要: 本申请实施例公开了一种三维模型的重建方法、装置、设备及存储介质,属于三维重建技术领域。该方法包括:获取彩色图像序列,所述彩色图像序列中包含至少两张彩色图像,所述至少两张彩色图像为不同视角下对目标场景进行拍摄得到;基于所述彩色图像序列,确定所述目标场景对应的符号距离场,以及所述目标场景中各个空间点对应的几何特征;基于所述符号距离场以及所述几何特征,确定各个视角下所述彩色图像对应的渲染图像;基于所述彩色图像与所述渲染图像之间的颜色差异,对所述符号距离场进行细节优化,得到优化后的符号距离场;基于所述优化后的符号距离场进行三维重建,得到所述目标场景对应的三维模型;提高了三维模型重建的准确性。

    图像处理方法、装置、电子设备及存储介质

    公开(公告)号:CN117218006A

    公开(公告)日:2023-12-12

    申请号:CN202211445729.0

    申请日:2022-11-18

    摘要: 本申请涉及图像处理方法、装置、电子设备及存储介质。上述方法包括基于特征关联信息对第一图像进行去阴影处理,得到第二图像,特征关联信息用于指示第一类特征与第二类特征之间的关联关系,第一类特征是第一图像的特征,第二类特征是第一图像对应的深度图像的特征;基于第一掩膜图像的注意力权重,对第二图像进行阴影边界修正,得到目标图像,第一掩膜图像用于指示第一图像或者第二图像的阴影边界。本申请提高了所获得的目标图像的去阴影效果,减少了目标图像中出现伪影的情况。本申请实施例可应用于云技术、人工智能、智慧交通、智慧娱乐等各种场景。

    虚拟对象动作生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN116681810B

    公开(公告)日:2023-10-03

    申请号:CN202310970212.1

    申请日:2023-08-03

    摘要: 本申请涉及一种虚拟对象动作生成方法、装置、计算机设备和存储介质。所述方法包括:获取动作描述文本;对动作描述文本进行语义层次化解析,得到多个语义层级的动作描述信息,并获取用于生成虚拟对象动作的采样噪声信号;对多个语义层级的动作描述信息进行编码,得到多个语义层级各自的动作描述表征;基于多个语义层级各自的动作描述表征,对采样噪声信号进行多个语义层级的降噪处理,得到级联降噪后的动作特征向量;其中,每个语义层级的降噪处理输出的动作特征向量的粒度级逐语义层级递减;对级联降噪后的动作特征向量进行解码,得到虚拟对象动作。采用本方法能够提高所生成的虚拟对象动作的准确度。

    基于动作生成模型的动作生成方法、装置及设备

    公开(公告)号:CN116702707A

    公开(公告)日:2023-09-05

    申请号:CN202310969504.3

    申请日:2023-08-03

    摘要: 本申请公开了一种基于动作生成模型的动作生成方法、装置及设备,涉及人工智能技术领域。所述方法包括:获取包含动作信息的输入文本;通过文本编码器生成输入文本对应的文本特征;通过基础扩散模型在第一维度的特征空间下,根据文本特征生成与输入文本的语义相匹配的中间动作序列;通过进阶扩散模型在第二维度的特征空间下,对中间动作序列进行细节增强处理,生成与输入文本相匹配的输出动作序列,第二维度大于第一维度。本申请通过基础扩散模型初步生成与输入文本的语义相匹配的中间动作序列,并通过进阶扩散模型对中间动作序列进行细节增强处理,提升了输出动作序列中的细节丰富度。

    虚拟对象动作生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN116681810A

    公开(公告)日:2023-09-01

    申请号:CN202310970212.1

    申请日:2023-08-03

    摘要: 本申请涉及一种虚拟对象动作生成方法、装置、计算机设备和存储介质。所述方法包括:获取动作描述文本;对动作描述文本进行语义层次化解析,得到多个语义层级的动作描述信息,并获取用于生成虚拟对象动作的采样噪声信号;对多个语义层级的动作描述信息进行编码,得到多个语义层级各自的动作描述表征;基于多个语义层级各自的动作描述表征,对采样噪声信号进行多个语义层级的降噪处理,得到级联降噪后的动作特征向量;其中,每个语义层级的降噪处理输出的动作特征向量的粒度级逐语义层级递减;对级联降噪后的动作特征向量进行解码,得到虚拟对象动作。采用本方法能够提高所生成的虚拟对象动作的准确度。

    三维纹理图像的生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN116977531A

    公开(公告)日:2023-10-31

    申请号:CN202310945819.4

    申请日:2023-07-28

    IPC分类号: G06T15/04 G06T15/20 G06T3/40

    摘要: 本申请涉及一种三维纹理图像的生成方法、装置、计算机设备、存储介质和计算机程序产品。所述方法可应用于人工智能领域,该方法包括:获取三维物体模型和纹理描述文本;在不同视角下对三维物体模型进行渲染,得到各视角下的第一模型渲染图像和用于表示三维物体模型在各视角下的第一深度图像;针对各视角下的第一模型渲染图像,通过纹理场对第一模型渲染图像进行纹理处理,得到二维的参考纹理;将参考纹理作为噪声数据添加至去噪过程图像,得到加噪图像;根据加噪图像、纹理描述文本和第一深度图像进行图像生成,获得各视角下的纹理图像;拼接各视角下的纹理图像,得到三维纹理图像。采用本方法能够有效提高三维纹理图像的纹理一致性和图像质量。

    基于动作生成模型的动作生成方法、装置及设备

    公开(公告)号:CN116702707B

    公开(公告)日:2023-10-03

    申请号:CN202310969504.3

    申请日:2023-08-03

    摘要: 本申请公开了一种基于动作生成模型的动作生成方法、装置及设备,涉及人工智能技术领域。所述方法包括:获取包含动作信息的输入文本;通过文本编码器生成输入文本对应的文本特征;通过基础扩散模型在第一维度的特征空间下,根据文本特征生成与输入文本的语义相匹配的中间动作序列;通过进阶扩散模型在第二维度的特征空间下,对中间动作序列进行细节增强处理,生成与输入文本相匹配的输出动作序列,第二维度大于第一维度。本申请通过基础扩散模型初步生成与输入文本的语义相匹配的中间动作序列,并通过进阶扩散模型对中间动作序列进行细节增强处理,提升了输出动作序列中的细节丰富度。

    一种视频检测方法、系统及存储介质和服务器

    公开(公告)号:CN114581821A

    公开(公告)日:2022-06-03

    申请号:CN202210166453.6

    申请日:2022-02-23

    摘要: 本发明实施例公开了一种视频检测方法、系统及存储介质和服务器,应用于基于人工智能的信息处理技术领域。视频检测系统会将目标视频分为多个模态的目标检测数据,分别获取到对应的单模态注意特征,再将这些单模态注意特征进行融合得到目标视频的全局特征,然后获取到全局特征与特定检测信息之间的相似性特征信息,并基于相似性特征信息确定与特定检测信息相关的视频片段。这样通过对各个模态的目标检测数据的单独处理,可以较精确地获取目标视频中包含的所有类型的信息,进而将各个单模态注意特征融合得到的全局特征能更真实地反映目标视频,最终确定的视频片段也更准确。