基于扩散模型的AI摄影方法、装置及设备

    公开(公告)号:CN118261780A

    公开(公告)日:2024-06-28

    申请号:CN202410457501.6

    申请日:2024-04-16

    发明人: 廖睿勇

    摘要: 本申请提供一种基于扩散模型的AI摄影方法、装置及设备。其中,通过对原始图像中的皮肤区域进行精确分割和生成遮罩保护,有效避免了手部等部位由于重绘导致的形态失真。同时,组合使用了两个控制模型,包括利用控制景深的景深控制模型,通过分析原始图像的景深对扩散模型进行控制,确保重绘服装等与原人物的景深一致性,显著提高了服装等与人物的贴合度;以及利用控制局部重绘的重绘控制模型,通过加强对原始图像的信息理解,增强重绘区域与非重绘区域的一致性控制,从而使生成图像的内容和细节与非重绘区域有更好的融合度,边缘衔接更自然。因此,采用本申请的方案,能够提高AI摄影的实用性和艺术效果。

    图像处理方法、装置、电子设备、图像处理系统及介质

    公开(公告)号:CN116612168B

    公开(公告)日:2024-06-28

    申请号:CN202310429893.0

    申请日:2023-04-20

    IPC分类号: G06T7/50 G06T3/4038

    摘要: 本公开提供了图像处理方法、图像处理装置、电子设备、图像处理系统、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及计算机视觉技术领域等。具体实现方案为:基于第一信息采集装置采集的目标第一图像,确定目标第一图像中的目标对象与目标平面之间的拍摄距离,目标平面为第二信息采集装置中的多个目标第二信息采集单元所处的平面;基于拍摄距离,确定拼接参数;以及基于拼接参数,对由多个目标第二信息采集单元采集的多个目标第二图像进行拼接,生成目标图像。

    深度数据的生成方法及装置、电子设备和可读存储介质

    公开(公告)号:CN118247320A

    公开(公告)日:2024-06-25

    申请号:CN202410378869.3

    申请日:2024-03-29

    发明人: 辛桐

    摘要: 本申请公开了一种深度数据的生成方法及装置、电子设备和可读存储介质,属于数据处理技术领域。其中,生成方法包括:获取第一图像数据,第一图像数据包含色彩信息;分别将第一图像数据输入至N个第一模型,得到第一图像数据对应的N个第一深度信息,第一模型为预训练的深度估计模型,N为正整数;根据N个第一深度信息和元学习器得到第二深度信息;根据第二深度信息生成训练数据,训练数据用于对第二模型进行训练,以得到更新的深度估计模型。

    一种非圆行星齿轮的质量异常检测方法

    公开(公告)号:CN117974666B

    公开(公告)日:2024-06-25

    申请号:CN202410385905.9

    申请日:2024-04-01

    摘要: 本发明涉及图像数据处理技术领域,具体涉及一种非圆行星齿轮的质量异常检测方法;根据卷积神经网络获取外观图像的疑似异常区域;根据外观图像和疑似异常区域的灰度差异特征获得疑似点蚀区域,根据疑似点蚀区域的形态特征和边缘轮廓的变化特征获得疑似点蚀区域的形状特征值;根据疑似点蚀区域的灰度分布特征和梯度分布特征获得疑似点蚀区域的深度特征值。本发明根据形状特征值和深度特征值获得目标点蚀指数;根据疑似点蚀区域的目标点蚀指数获取非圆行星齿轮的目的点蚀区域,避免图像视觉算法将所有疑似异常区域认为点蚀区域,提高了非圆行星齿轮点蚀状况的检测准确性。

    一种距离检测方法、车辆及计算机可读存储介质

    公开(公告)号:CN118229751A

    公开(公告)日:2024-06-21

    申请号:CN202311287377.5

    申请日:2023-09-27

    IPC分类号: G06T7/50

    摘要: 本公开提供了一种距离检测方法、车辆及计算机可读存储介质,该方法包括:获取相机的镜头的实际高度、所述镜头的光心到所述相机的成像平面的设定距离;通过实时计算得到的目标对象在所述成像平面上的投影到所述光心在所述成像平面上的投影的第一纵向像素距离,结合所述镜头的实际高度和所述设定距离,得到所述目标对象到所述相机的镜头平面的第一实际距离。

    一种基于监督学习的单目图像深度估计方法

    公开(公告)号:CN118229750A

    公开(公告)日:2024-06-21

    申请号:CN202211628782.4

    申请日:2022-12-19

    发明人: 朴燕 王琦 王宇

    摘要: 本发明提供一种基于监督学习的单目图像深度估计方法,属于三维信息成像领域,所述单目图像深度估计方法中包含共享参数网络模型、语义分割模型以及训练步骤,共享参数网络模型利用语义分割信息指导深度估计学习额外信息,降低所估计的深度图像精度对于网络深度的依赖,缓解所需的硬件负担;语义分割模型通过多尺度特征融合模块充分利用编码过程中的高级语义特征对图像区域进行类别识别,利用低级视觉特征生成清晰的边界,从而实现大景深场景、不同物体间界限和局部细节的完整表现;对于深度估计网络的训练步骤,利用混合的不同源深度数据集进行训练,增加数据的互补性,以解决现有的数据量缺乏和混合数据间不兼容的问题,实现模型的可泛化目标。

    基于增强现实的显示方法、装置、设备及可读存储介质

    公开(公告)号:CN118227061A

    公开(公告)日:2024-06-21

    申请号:CN202211608325.9

    申请日:2022-12-14

    IPC分类号: G06F3/14 G06T7/73 G06T7/50

    摘要: 本申请实施例提供一种基于增强现实的显示方法、装置、设备及可读存储介质,电子设备位于自移动设备的上方且平行于自移动设备时,在预览界面上显示包含自移动设备的预览图像,当用户下发触发指令后,电子设备获取自移动设备在世界坐标系下的第一位姿以及自移动设备在AR坐标系下的第二位姿,根据第一位姿和第二位姿确定任意点在世界坐标系下的坐标和在AR坐标系下的坐标的转换关系,进而根据转换关系呈现AR场景。采用该种方案,通过在预览界面上触发电子设备确定任意点在世界坐标系下的坐标和在AR坐标系下的坐标的转换关系,根据转换关系及增强现实方式呈现自移动设备的当前环境,直观且准确度高,进而实现对自移动设备的精确控制。