一种人体姿态估计方法、装置、计算机设备及存储介质

    公开(公告)号:CN116597513A

    公开(公告)日:2023-08-15

    申请号:CN202310563069.4

    申请日:2023-05-17

    摘要: 本申请涉及一种人体姿态估计方法、装置、计算机设备以及存储介质。所述方法包括:将待检测的RGB视频序列输入骨干网络,通过所述骨干网络从RGB视频序列中提取2D人体姿态序列;将所述2D人体姿态序列输入基于卷积神经网络和自注意力机制的时空信息编码模块,所述时空信息编码模块交替使用空间信息编码器和时间信息编码器对所述2D人体姿态序列进行特征编码,并输出时空特征编码信息;使用解码器将所述时空特征编码信息映射为3D坐标,并输出3D人体姿态序列。本申请利用注意力机制自适应地学习视频图像的特征,并将注意力集中于人体关节点之间的时空关系,能够更好地处理视频图像中人体姿态的时空关系,提高人体姿态估计的精度和效率。

    基于注意力机制的多模态信息融合识别方法及系统

    公开(公告)号:CN114332573A

    公开(公告)日:2022-04-12

    申请号:CN202111557072.2

    申请日:2021-12-18

    摘要: 本发明涉及一种基于注意力机制的多模态信息融合识别方法及系统。该方法及系统首先对人体动作的RGB和depth视频帧序列进行压缩表示,生成整个视频的时空信息表示图;然后分别将RGB和depth的时空表示图输入双流深度卷积网络提取其高层语义特征;之后将这两种模态的特征输入注意力信息融合模块得到两个不同的多模态融合特征表示;最后将这两个多模态特征向量相加或拼接操作整合成一个特征向量,通过全连接层和softmax函数分类,得到待测视频中的所属动作类,能够有效地利用RGB和depth数据的互补信息,产生语义丰富的多模态特征表示,极大地提高人体动作识别的准确率和抗干扰能力。

    巡检路径处理方法、装置、设备及可读存储介质

    公开(公告)号:CN115309148A

    公开(公告)日:2022-11-08

    申请号:CN202210794421.0

    申请日:2022-07-07

    IPC分类号: G05D1/02

    摘要: 本申请适用于巡检技术领域,提供了一种巡检路径处理方法、装置、设备及可读存储介质,该方法包括:获取多个待巡检位置;确定多个巡检位置中的任意两个待巡检位置之间的可行路径,每条可行路径皆避开障碍物,根据每条可行路径的路径代价,对每条可行路径进行筛选,得到多条巡检路径,从多条巡检路径中,将最小的路径代价总和对应的巡检路径确定为目标巡检路径。从而,本申请根据障碍物得到多条可行路径,再根据每条可行路径的路径代价确定巡检顺序,确定巡检路径,保证巡检路径更加合理或可靠,同时,确定出路径代价总和最小的目标巡检路径,提高了巡检路径的可行性。