一种基于数据增强的轻量化短视频场景分类方法

    公开(公告)号:CN118135446A

    公开(公告)日:2024-06-04

    申请号:CN202311376700.6

    申请日:2023-10-23

    摘要: 本发明是一种基于数据增强的轻量化短视频场景分类方法,属于短视频分类技术。本发明包括:利用余弦相似度算法进行短视频关键帧抽取;进行图像预处理,在训练阶段进行数据增强以丰富样本数据;基于ResNet50模型设计轻量化的场景分类模型,对预处理后的图像进行场景分类;采用置信度阈值和平均机制进行帧间结果后处理,输出最终短视频场景分类结果。本发明的轻量化的场景分类模型降低了模型参数量,同时利用多感受野的特征融合,获取更全面的信息,改善模型对复杂场景的理解和分类能力,实现了视频场景分类准确度和推理速度的平衡,具有更高的泛化能力和鲁棒性,可以应用于短视频场景分类、实时视频处理等领域,具有广阔的应用前景。