-
公开(公告)号:CN114613001A
公开(公告)日:2022-06-10
申请号:CN202210108698.3
申请日:2022-01-28
申请人: 厦门理工学院
摘要: 本发明提出一种多视图中基于高质量热图的3D人体姿态估计方法,首先通过将不同试图输入到HRNet网络,得到各个视图相对应的2D人体姿态热图;对每个人体姿态热图分配一个与数据相关的权重,得到高质量热图值;再融合包含被检测目标人物丰富信息的3D特征卷,得到被检测目标人物的大致定位,再构建一个以每个目标人为中心的单独的细粒度特征卷,并将其输入人体姿态回归网络,最终估计详细的三维人体姿态;本发明提供的方法能够实现准确的三维人体姿态估计。
-
公开(公告)号:CN114565637B
公开(公告)日:2024-05-14
申请号:CN202210041658.1
申请日:2022-01-14
申请人: 厦门理工学院
IPC分类号: G06T7/246 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明提供了一种基于特征增强和视频历史帧的单目标跟踪方法,首先从查询帧之前的视频序列中作为历史帧集合,然后加入标签图进行掩膜处理;随后,与当前查询帧一起送入特征提取网络提取目标特征,对历史帧特征进行拼接后送入历史帧读取和特征增强网络;通过离线训练模型EnhanceNet提供的卷积参数对历史帧特征进行增强,并使用softmax函数计算与查询帧特征的相似度矩阵。最后,将相似度矩阵与查询帧特征拼接送入头部网络,进行分类和回归,从而预测目标位置。本发明方法提高了目标跟踪算法在复杂场景下的鲁棒性和准确率并保持跟踪的实时性要求。
-
公开(公告)号:CN114565520A
公开(公告)日:2022-05-31
申请号:CN202210042334.X
申请日:2022-01-14
申请人: 厦门理工学院
摘要: 本发明提供了一种融合注意力机制的多输入多输出图像快速去模糊方法,所述方法应用到多输入多输出图像快速去模糊网络,所述网络包括:编码层、解码层、浅卷积块、信息补充块、非对称特征融合块、卷积层;首先输入一张模糊图像,通过两次双线性下采样获取两张不同尺度的图像,从大到小依次馈入编码块中对图像进行去模糊;在解码器中,将上一层传入的特征信息与信息补充块获取到的其他层编码器的信息进行拼接,用于恢复潜在图像,最后将上一层的特征信息和用非对称特征融合块获取到其他三层编码的信息进行拼接,用于生成最终的潜在图像。本发明方法通过引入注意力机制和信息补充块,用于减少恢复图像所需要的时间和提升恢复图像的精度。
-
公开(公告)号:CN114565637A
公开(公告)日:2022-05-31
申请号:CN202210041658.1
申请日:2022-01-14
申请人: 厦门理工学院
摘要: 本发明提供了一种基于特征增强和视频历史帧的单目标跟踪方法,首先从查询帧之前的视频序列中作为历史帧集合,然后加入标签图进行掩膜处理;随后,与当前查询帧一起送入特征提取网络提取目标特征,对历史帧特征进行拼接后送入历史帧读取和特征增强网络;通过离线训练模型EnhanceNet提供的卷积参数对历史帧特征进行增强,并使用softmax函数计算与查询帧特征的相似度矩阵。最后,将相似度矩阵与查询帧特征拼接送入头部网络,进行分类和回归,从而预测目标位置。本发明方法提高了目标跟踪算法在复杂场景下的鲁棒性和准确率并保持跟踪的实时性要求。
-
公开(公告)号:CN114564610A
公开(公告)日:2022-05-31
申请号:CN202210042348.1
申请日:2022-01-14
申请人: 厦门理工学院
IPC分类号: G06F16/583 , G06V10/44 , G06V10/74 , G06K9/62
摘要: 本发明提出一种基于半监督的中心乘积量化图像检索方法,通过特征提取后将空间切分为若干个子空间,然后对特征向量进行归一化处理,计算余弦距离让子向量能找到相应子空间中最接近的码字。计算过程中使用半监督损失模块减小量化误差,最小化标记数据的经验误差和未标记数据的嵌入误差,最后用码字替代子向量化为二进制码存储到乘积量化查找表中,通过非对称距离计算进行图像检索;本发明提出的方法具有更强的鲁棒性,提高图像检索的精度。
-
-
-
-