自适应图结构的视频摘要生成方法

    公开(公告)号:CN115525782A

    公开(公告)日:2022-12-27

    申请号:CN202211197783.8

    申请日:2022-09-29

    摘要: 本发明涉及计算机视觉技术领域,公开了一种获取原始视频帧序列,并根据原始视频帧序列得到局部特征Sdata;根据原始视频帧序列中每个镜头的SVDframe和代表性帧构建邻接矩阵在TAMGCN网络模型中采用注意力机制,根据当前层的输入Sdata计算的注意力矩阵,得到整个层的图注意力输出根据注意力矩阵得到TAMGCN网络模型的输出graphfeature;根据局部特征Sdata计算时序特征Globalfeature;将时序特征Globalfeature与graphfeature进行特征融合,得到原始视频帧序列中每个镜头的得分;根据每个镜头的得分采用背包算法选取若干个的镜头进行组合,得到原始视频的视频摘要。本发明提供的方法,构对视频镜头有更好的处理能力,其中的注意力部分可以有效的关注到其中具有代表性和多样性的镜头,使得生成的摘要更具代表性和多样性。