基于双向卷积长短期记忆网络的动态视频摘要算法及系统

    公开(公告)号:CN114979801A

    公开(公告)日:2022-08-30

    申请号:CN202210504819.6

    申请日:2022-05-10

    摘要: 本发明提供了一种基于双向卷积长短期记忆网络的动态视频摘要算法及系统,包括如下步骤:使用在Image数据集上训练好的InceptionResNetV2网络作为编码器提取每帧的深度空间特征;使用双向ConvLSTM对每一帧的特征图进行前向和后向的时空建模,捕获特征图内的空间结构信息和视频时序上的长短期依赖关系;将视频帧的时空语义信息通过全连接层和非线性映射层回归生成帧级重要性分数;根据背包算法选择关键镜头并生成动态摘要,建立与数据集真实值注释的均方误差损失函数。本发明提出了端到端的基于双向卷积长短期记忆动态视频摘要网络,具有监督的编码器‑解码器视频摘要框架,可以学习视频中复杂的时空语义结构关系。

    基于结构特征的快速鲁棒图像识别跟踪方法和装置

    公开(公告)号:CN111461196A

    公开(公告)日:2020-07-28

    申请号:CN202010229998.8

    申请日:2020-03-27

    IPC分类号: G06K9/62

    摘要: 本发明提供一种基于结构特征的快速鲁棒图像识别跟踪方法和装置,所述方法采用GMS特征匹配算法,对查询图像与训练匹配图像进行特征点匹配对筛选;若存在正确的特征点匹配对,将查询图像与训练匹配图像中感兴趣区域等分成小的网格,为每个网格确定关键点;将关键点建模作为图的节点,构建图模型,将特征匹配与图匹配的权重参数相融合;用随机游走算法完成对图的近似匹配,完成图像识别跟踪。本发明可有效加速匹配识别方法,在较少的特征点匹配对情况下,提供更准确的识别跟踪性能。

    一种基于多尺度注意力内容感知的视频码率控制方法

    公开(公告)号:CN118354080A

    公开(公告)日:2024-07-16

    申请号:CN202410593173.2

    申请日:2024-05-14

    摘要: 本发明提供一种基于多尺度注意力内容感知的视频码率控制方法,包括:帧级目标比特分配和CTU级目标比特分配;所述帧级目标比特分配包括:计算视频编码帧与前向和后向参考帧的帧差得到编码帧差,并确定视频时域预测结构参数;使用所述编码帧差和所述视频时域预测结构参数确定帧级目标比特分配权重和分配策略;所述CTU级目标比特分配包括:采用多尺度注意力的视频显著性检测模块提取视频显著性特征,确定人眼对不同区域的感兴趣程度;使用所述视频显著性特征确定CTU级目标比特分配权重和分配策略。本发明在图像全局质量损失很小的情况下,显著性区域的码率可以节省19.52%,视频的主观质量也有了明显的提升。

    基于视频的无人机识别与跟踪方法及装置

    公开(公告)号:CN111460968B

    公开(公告)日:2024-02-06

    申请号:CN202010231230.4

    申请日:2020-03-27

    摘要: 本发明提供了一种基于视频的无人机识别与跟踪方法及装置,该方法包括:对收集的数据集逐个进行手工无人机的标注,获得多个型号且不同尺寸的无人机标注样本;以此数据集对基于YOLOv3的网络进行训练,得到训练后的深度学习目标检测模型;采用Retinex图像增强手段提高待检测的无人机视频的图像质量,通过深度学习目标检测模型识别待检测的无人机视频每一帧;基于Sort算法实现快速对视频中的无人机跟踪。本发明可以高鲁棒高精度识别视频中的无人机并跟踪无人机,并且当无人机图像不清晰时,可以进行图像增强,适用于各种复杂场景。

    一种基于快速重编码的HEVC到VVC视频转码方法及系统

    公开(公告)号:CN118474385A

    公开(公告)日:2024-08-09

    申请号:CN202410593176.6

    申请日:2024-05-14

    摘要: 本发明公开了一种基于快速重编码的HEVC到VVC的视频转码方法,包括:采用深度重用算法,利用HEVC解码端提取的编码块划分深度缩小VVC划分搜索的深度范围,其中,对于四叉树划分深度差大于设定阈值的编码单元直接执行跳过或提前终止划分,实现初步剪枝;根据所述VVC划分搜索的深度范围,使用决策树判断剩余深度上执行四叉树划分的可能性,并根据判断结果对多类型树划分进行细化剪枝;在所述细化剪枝的基础上设定仿射预测提前终止的条件,根据所述提前终止的条件对VVC中冗余度高的仿射预测模式提前终止。本发明可以用于解决HEVC到VVC转码速度过慢的问题。

    基于结构特征的快速鲁棒图像识别跟踪方法和装置

    公开(公告)号:CN111461196B

    公开(公告)日:2023-07-21

    申请号:CN202010229998.8

    申请日:2020-03-27

    IPC分类号: G06V10/75 G06V10/80

    摘要: 本发明提供一种基于结构特征的快速鲁棒图像识别跟踪方法和装置,所述方法采用GMS特征匹配算法,对查询图像与训练匹配图像进行特征点匹配对筛选;若存在正确的特征点匹配对,将查询图像与训练匹配图像中感兴趣区域等分成小的网格,为每个网格确定关键点;将关键点建模作为图的节点,构建图模型,将特征匹配与图匹配的权重参数相融合;用随机游走算法完成对图的近似匹配,完成图像识别跟踪。本发明可有效加速匹配识别方法,在较少的特征点匹配对情况下,提供更准确的识别跟踪性能。

    人眼视觉和机器视觉协同的图像特征压缩和解压缩方法

    公开(公告)号:CN116366863A

    公开(公告)日:2023-06-30

    申请号:CN202310207420.6

    申请日:2023-03-07

    摘要: 本发明提供了一种人眼视觉和机器视觉协同的图像特征压缩和解压缩方法,在编码端,生成具有任务先验信息的重要性掩码图并加入到图像特征提取器的局部通道中后,获得紧凑基础特征;将紧凑基础特征中具有任务先验信息的局部通道特征进行多尺度融合,获得紧凑辅助特征;基于紧凑基础特征和紧凑辅助特征,获得压缩传输的码流,完成图像特征压缩。在解码端,将紧凑量化基础特征进行重构解码,获得面向人眼视觉的重构图像;将紧凑量化基础特征与紧凑量化辅助特征进行融合,得到面向视觉任务的紧凑量化双流特征;将紧凑量化双流特征与视觉任务所需特征进行对齐训练,获得紧凑量化双流转换特征,完成任务解码。本发明在实际应用中更具灵活性。

    基于视频的无人机识别与跟踪方法及装置

    公开(公告)号:CN111460968A

    公开(公告)日:2020-07-28

    申请号:CN202010231230.4

    申请日:2020-03-27

    摘要: 本发明提供了一种基于视频的无人机识别与跟踪方法及装置,该方法包括:对收集的数据集逐个进行手工无人机的标注,获得多个型号且不同尺寸的无人机标注样本;以此数据集对基于YOLOv3的网络进行训练,得到训练后的深度学习目标检测模型;采用Retinex图像增强手段提高待检测的无人机视频的图像质量,通过深度学习目标检测模型识别待检测的无人机视频每一帧;基于Sort算法实现快速对视频中的无人机跟踪。本发明可以高鲁棒高精度识别视频中的无人机并跟踪无人机,并且当无人机图像不清晰时,可以进行图像增强,适用于各种复杂场景。