一种基于跨模态对齐的单目视频人体运动生成方法

    公开(公告)号:CN118334735A

    公开(公告)日:2024-07-12

    申请号:CN202410374025.1

    申请日:2024-03-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于跨模态对齐的单目视频人体运动生成方法,包括:构建骨架拓扑结构,获取以BVH格式存储运动数据且包含对应运动视频的数据集;采用卷积为人体上半身和下半身的数据分别设计一个运动自编码器网络,用于从人体运动数据中分上、下半身学习两组运动先验;采用卷积设计一组同样分上、下半身的视觉编码器,将视觉信息映射到隐空间中,并采用跨模态对齐的方式将上、下半身对应的视觉隐空间与各自的运动先验对齐;训练完成后以视频序列和从中提取的二维关键点作为输入,输出对应的人体运动的完整表达。本发明可以从视觉信息输入中重建出长度准取的骨架信息;运动先验的引入使得本方法能够大大提高从视频中重建运动的精度。

    基于神经辐射场的水下低光静态场景三维重建及增强方法

    公开(公告)号:CN119068113A

    公开(公告)日:2024-12-03

    申请号:CN202411121705.9

    申请日:2024-08-15

    Applicant: 浙江大学

    Inventor: 孙浩 邹常青

    Abstract: 本发明公开了一种基于神经辐射场的水下低光静态场景三维重建及增强方法,包括如下步骤:通过相机获取多曝光的水下低光静态场景的可见光学图像数据;计算拍摄可见光学图像对应的相机内外参;构建水下低光静态场景的神经辐射场模型;将相机采集的可见光学图像以及对应的相机内外参输入神经辐射场模型进行监督训练;基于视觉理论构建亮度增强模型;将训练好的神经辐射场输入亮度增强模型进行监督训练,输出去除水介质干扰、增亮后的水下三维场景模型。本发明方法能够有效降低由于海水对光的吸收和散射、低光拍摄噪声等干扰因素对三维重建精度的影响,显著提高水下低光静态场景三维重建的真实性和准确性。

Patent Agency Ranking