-
公开(公告)号:CN119941818A
公开(公告)日:2025-05-06
申请号:CN202510052711.1
申请日:2025-01-14
Applicant: 北京邮电大学
IPC: G06T7/55 , G06T7/00 , G06T3/4038 , G06T3/4046 , G06T3/4053 , G06T3/4007 , G06V10/774 , G06V10/77 , G06V10/82 , G06V10/80 , G06N3/0442 , G06N3/0464 , G06N3/084 , G06N5/04
Abstract: 本发明公开了一种双目视差估计的通用深度学习方法,针对不同视差范围数据集迁移适应性差的问题,提出了一种具有高泛化能力的网络结构;通过学习从图像函数空间到视差函数空间的映射,模型支持自定义视差范围和多尺度训练,能够动态构建具备可变尺度和视差感知的代价几何体,同时引入Galerkin注意力机制,降低计算复杂度和显存消耗;本方法包括数据处理、多级特征提取、代价几何体构建、Galerkin注意力机制、特征聚合及迭代优化等核心步骤;结合本方法的实施实例,模型提升了视差估计的精度和可靠性,在多场景、多种分辨率下具备显著的适应性和推理效率。