人群密度的估计方法、装置、设备及存储介质
摘要:
本申请提供了一种人群密度的估计方法、装置、设备及存储介质,该方法包括:获取待处理视频中的多个视频帧;将多个视频帧依次输入人群密度估计模型中,以输出每个视频帧对应的具有上下文信息的人群密度图,人群密度估计模型包括依次连接的1个三维卷积(3D Conv)模块、N个伪三维卷积(P3D Conv)模块和M个二维卷积(2D Conv)模块,N个伪三维卷积(P3D Conv)模块中均包括注意力单元,注意力单元用于提取多个视频帧之间的时间相关性。通过该方法,能够提取并结合视频帧之间的时间相关性信息,确定视频帧对应的人群密度图,进而提升了视频人群计数的精度。
0/0