视频显著性区域检测方法、装置、电子设备及存储介质
摘要:
本发明公开了一种视频显著性区域检测方法、装置、电子设备及存储介质。所述方法包括如下步骤:获取待传输视频序列,输入到训练好的视频显著性区域检测网络中;采用3D卷积主干网络的编码器,提取多尺度时空特征;通过帧间注意力模块,增强深度特征的时间特性;将多尺度时空特征传入双向时空金字塔中,采用注意力引导融合机制进行融合;将融合后的特征传入解码器中,进行求和与上采样,恢复原始视频帧尺寸,以获取最终的视频显著性图,为后期视频通信服务。所述方法探索多尺度时空特征高效融合方式,提高视频显著性区域检测精度,且计算复杂度低,在精度和计算时间上均有明显优势。
0/0