-
公开(公告)号:CN117808933A
公开(公告)日:2024-04-02
申请号:CN202410225064.5
申请日:2024-02-29
申请人: 成都索贝数码科技股份有限公司
IPC分类号: G06T11/60 , G06N3/0455 , G06N3/0464 , G06T5/50
摘要: 本发明提供了一种图像要素分解与重构方法及装置,包括:要素分解:对原始图像进行语义理解,分解出图像中的原始要素;要素处理:对原始要素进行处理,得到优化后的要素;要素重组:创建画布,并将优化后的要素进行缩放、旋转和/或平移操作,完成相应要素的布局重组;融合生成:对重组后的要素进行融合生成,得到相应尺寸的重构图像。本发明通过分解和重组图像要素来引导图像生成,得到保留原始要素的高质量重构图像,充分利用了生成模型的创造性并具有较强的可控性,可以广泛应用于图像编辑和图像生成。
-
公开(公告)号:CN116958453A
公开(公告)日:2023-10-27
申请号:CN202311211058.6
申请日:2023-09-20
申请人: 成都索贝数码科技股份有限公司
摘要: 本发明提供了一种基于神经辐射场的三维模型重建方法、设备和介质,方法包括以下步骤:提取目标的先验信息:采集多视角的RGB图像并进行处理得到目标的位姿信息;神经辐射场模型训练:使用目标的位姿信息训练神经辐射场模型,完成三维模型的隐式表达;生成初始的mesh模型:采用面绘制算法从神经辐射场中提取一个mesh模型作为初始mesh模型;优化目标的三维模型:基于初始mesh模型,利用可微分的光栅化渲染得到渲染图像并计算渲染损失进行反向传播,从而对三维模型的几何形状和外观纹理进行优化;导出通用三维模型。本发明可以完成大范围场景的三维重建并且具有更好的通用性,其得到的模型可以在大多数的三维模型处理软件中使用。
-
公开(公告)号:CN117808933B
公开(公告)日:2024-05-24
申请号:CN202410225064.5
申请日:2024-02-29
申请人: 成都索贝数码科技股份有限公司
IPC分类号: G06T11/60 , G06N3/0455 , G06N3/0464 , G06T5/50
摘要: 本发明提供了一种图像要素分解与重构方法及装置,包括:要素分解:对原始图像进行语义理解,分解出图像中的原始要素;要素处理:对原始要素进行处理,得到优化后的要素;要素重组:创建画布,并将优化后的要素进行缩放、旋转和/或平移操作,完成相应要素的布局重组;融合生成:对重组后的要素进行融合生成,得到相应尺寸的重构图像。本发明通过分解和重组图像要素来引导图像生成,得到保留原始要素的高质量重构图像,充分利用了生成模型的创造性并具有较强的可控性,可以广泛应用于图像编辑和图像生成。
-
公开(公告)号:CN118870119A
公开(公告)日:2024-10-29
申请号:CN202411367209.1
申请日:2024-09-29
申请人: 成都索贝数码科技股份有限公司
IPC分类号: H04N21/44 , H04N21/472 , G06T11/60 , G06T7/246 , G06V10/26 , G06T7/194 , G06V10/25 , G06V10/28 , G06V20/40 , G06V10/62 , G06V10/82
摘要: 本申请公开了一种多视频对象合成方法,涉及图像生成技术领域,利用图像分割算法和视频对象跟踪算法对原始对象视频进行跟踪并提取出原始对象视频中存在的目标对象视频,其次利用DDIM反演法对目标对象视频和所需背景视频进行反演得到反演结果,将目标对象视频和所需背景视频导入至可视化编辑界面进行编辑导出布局视频,最后利用反演结果进行视频重建,启动视频生成模型对布局视频进行处理得到包含对象和背景的视频。通过对象视频和背景视频来引导视频生成,生成保留原始视频对象的外观和运动特征且具有物理交互效果的高质量合成视频,具有较强的可控性。
-
公开(公告)号:CN116958453B
公开(公告)日:2023-12-08
申请号:CN202311211058.6
申请日:2023-09-20
申请人: 成都索贝数码科技股份有限公司
摘要: 本发明提供了一种基于神经辐射场的三维模型重建方法、设备和介质,方法包括以下步骤:提取目标的先验信息:采集多视角的RGB图像并进行处理得到目标的位姿信息;神经辐射场模型训练:使用目标的位姿信息训练神经辐射场模型,完成三维模型的隐式表达;生成初始的mesh模型:采用面绘制算法从神经辐射场中提取一个mesh模型作为初始mesh模型;优化目标的三维模型:基于初始mesh模型,利用可微分的光栅化渲染得到渲染图像并计算渲染损失进行反向传播,从而对三维模型的几何形状和外观纹理进行优化;导出通用三维模型。本发明可以完成大范围场景的三维重建并且具有更好的通用性,其得到的模型可以在大多数的三维模型处理软件中使
-
公开(公告)号:CN116934936A
公开(公告)日:2023-10-24
申请号:CN202311205617.2
申请日:2023-09-19
申请人: 成都索贝数码科技股份有限公司
摘要: 本申请公开了一种三维场景风格迁移方法、装置、设备及存储介质,首先采集多个视角下的RGB图像作为原始图像,对原始图像进行数据预处理得到相机位置姿态信息,然后将原始图像和相机位置姿态信息输入神经辐射场模型进行训练,构建原始三维场景,在原始三维场景中使用风格迁移网络对原始图像和风格图像进行风格迁移,得到风格迁移后的原始图像,最后以风格迁移后的原始图像作为监督数据,优化得到风格迁移后的三维场景。相较于现有技术具有更好的视觉效果,面对不同的风格图片时不需要再次训练整个神经辐射场,能够实现艺术风格和真实场景风格的三维场景风格迁移,使其具有更高的实用价值。
-
-
-
-
-