一种基于潜在扩散模型的双目图像生成方法及系统

    公开(公告)号:CN117523024B

    公开(公告)日:2024-03-26

    申请号:CN202410001455.9

    申请日:2024-01-02

    申请人: 贵州大学

    发明人: 杨文帮

    摘要: 本发明涉及双目图像生成领域,具体涉及一种基于潜在扩散模型的双目图像生成方法及系统。本发明提供的基于潜在扩散模型的双目图像生成方法,包括如下步骤:获取原始双目图像数据集,并标注所述原始双目图像数据集中任一对原始双目图像的双目视差;利用标注后的原始双目图像数据集,搭建并训练基于所述双目视差监督的扩散模型;设置目标双目图像风格,并根据所述目标双目图像风格利用训练好的扩散模型生成目标双目图像数据集。本发明通过引入潜在扩散模型,结合扩散过程和反向重建过程,在生成过程中考虑了噪声、视差和图像风格等因素,提高了生成图像在不同场景和风格下的逼真度,从而增强了双目视觉算法的跨域泛化性。

    一种基于潜在扩散模型的双目图像生成方法及系统

    公开(公告)号:CN117523024A

    公开(公告)日:2024-02-06

    申请号:CN202410001455.9

    申请日:2024-01-02

    申请人: 贵州大学

    发明人: 杨文帮

    摘要: 本发明涉及双目图像生成领域,具体涉及一种基于潜在扩散模型的双目图像生成方法及系统。本发明提供的基于潜在扩散模型的双目图像生成方法,包括如下步骤:获取原始双目图像数据集,并标注所述原始双目图像数据集中任一对原始双目图像的双目视差;利用标注后的原始双目图像数据集,搭建并训练基于所述双目视差监督的扩散模型;设置目标双目图像风格,并根据所述目标双目图像风格利用训练好的扩散模型生成目标双目图像数据集。本发明通过引入潜在扩散模型,结合扩散过程和反向重建过程,在生成过程中考虑了噪声、视差和图像风格等因素,提高了生成图像在不同场景和风格下的逼真度,从而增强了双目视觉算法的跨域泛化性。

    一种基于边缘检测的双目视觉立体匹配方法

    公开(公告)号:CN115049739A

    公开(公告)日:2022-09-13

    申请号:CN202210670652.0

    申请日:2022-06-14

    申请人: 贵州大学

    发明人: 杨文帮

    摘要: 本发明公开了一种基于边缘检测的双目视觉立体匹配方法,该双目视觉立体匹配方法包括:特征提取,相关性金字塔,GRU更新模块步骤,由于利用现有的立体匹配算法对图像进行立体匹配时,现有的工作通常依赖于3D卷积网络来处理立体成本量,使用RAFT‑Stereo作为整体框架,仅需要使用2D卷积和使用单个矩阵乘法构造的轻量级成本卷。为了解决无纹理,边界问题,通过一个语义金字塔来编码多任务语义信息,通过EdgeStereo,将RAFT‑Stereo中的上下文编码器置换为基于RINDNet的编码器,进行特征提取,具有很强的边界感知能力。通过使用迭代网络,我们可以通过早期停止轻松地进行效率的准确性。我们使用多层级GRU单元,以多种分辨率维护隐藏状态,交叉连接,但仍然生成单个高度区别差异更新。