一种视频目标编辑方法、终端设备及存储介质

    公开(公告)号:CN117294894A

    公开(公告)日:2023-12-26

    申请号:CN202311150398.2

    申请日:2023-09-07

    申请人: 华侨大学

    IPC分类号: H04N21/44 G06V20/40

    摘要: 本发明提供一种视频目标编辑方法、终端设备及存储介质,方法包括:获取视频信息、目标编辑操作、目标编号和视频目标参数;使用视频实例分割算法对视频中的帧图像进行目标分割,得到目标的像素级信息;输出对应操作和编号的相应图片列表,根据目标编辑操作,输出原帧列表、目标二值掩码列表、平移目标帧列表、平移目标二值掩码列表、缩放目标帧列表或缩放目标二值掩码列表;使用视频图像修复算法对视频画面进行修复,根据目标编辑操作,输出删除修复视频、平移修复视频列表或缩放修复视频。本发明能够更方便、高效及精确地实现视频目标编辑。

    基于多模态Transformer的零配件检测方法、装置及可读介质

    公开(公告)号:CN117274253A

    公开(公告)日:2023-12-22

    申请号:CN202311546437.0

    申请日:2023-11-20

    申请人: 华侨大学

    摘要: 本发明公开了一种基于多模态Transformer的零配件检测方法、装置及可读介质,涉及图像处理领域,包括:获取零配件的重量以及不同角度零配件图像叠加得到输入图像;构建零配件检测模型并训练,得到经训练的零配件检测模型,将输入图像和重量输入经训练的零配件检测模型,得到特征向量;建立包含已知型号的零配件的特征向量的零配件特征向量数据库;将待检测的零配件的输入图像和重量输入经训练的零配件检测模型,得到待检测的零配件的特征向量,将待检测的零配件的特征向量与零配件特征向量数据库中的特征向量进行比对,检测得到待检测的零配件的型号,解决传统的图像检测方法使用单一类型的数据对零配件型号检测的准确性差等问题。

    结合分类加强与细化微调的目标跟踪方法、装置及可读介质

    公开(公告)号:CN116739903A

    公开(公告)日:2023-09-12

    申请号:CN202310793797.4

    申请日:2023-06-30

    申请人: 华侨大学

    摘要: 本发明公开了一种结合分类加强与细化微调的目标跟踪方法、装置及可读介质,构建目标跟踪网络模型并训练,得到经训练的目标跟踪网络模型,将当前帧输入ResNet模块,将ResNet模块的输出特征输入全局感知模块,得到全局感知特征,将全局感知特征与模板帧输入分类加强模块,得到前景特征图和前景概率特征图;在第一分支中,将降维后的全局感知特征与模板帧输入判别相关滤波器,得到定位特征图;在第二分支中,将前景特征图、前景概率特征图和定位特征图融合得到混合特征图,将混合特征图与ResNet模块的部分输出特征输入微调路径模块,得到目标的掩膜,通过拟合掩膜,得到矩形框,细化微调模块根据矩形框提取目标的特征,并与模板帧做逐像素相关,得到目标跟踪框。

    基于高位位平面预测的图像压缩与可逆数据隐藏方法

    公开(公告)号:CN116708687A

    公开(公告)日:2023-09-05

    申请号:CN202310522131.5

    申请日:2023-05-10

    申请人: 华侨大学

    摘要: 本发明提供一种基于高位位平面预测的图像压缩与可逆数据隐藏方法,包括:图像所有者基于像素预测值和高位位平面预测完成图像无损压缩,以及将辅助数据嵌入数据嵌入空间;图像解压方解压缩并恢复高位位平面数据后可无损恢复原始图像;云端数据嵌入者根据密钥可以提取辅助数据并定位预留的数据嵌入空间,进而完成数据嵌入得到载密加密图像;授权接收者根据拥有的密钥权限可正确提取嵌入数据或无损恢复原始图像。本发明既能实现图像无损压缩与解压缩,也能实现加密图像大容量的可逆信息隐藏,进一步加强了图像内容的保护。

    一种基于多分支卷积神经网络的HEVC帧内预测方法

    公开(公告)号:CN109996084B

    公开(公告)日:2022-11-01

    申请号:CN201910361446.X

    申请日:2019-04-30

    申请人: 华侨大学

    摘要: 本发明涉及一种基于多分支卷积神经网络的HEVC帧内预测方法,属于视频编码领域,本方法使用多分支卷积神经网络,对每个CTU进行预处理,并分别作为不同分支的卷积神经网络的输入,经过卷积计算之后,将得到的特征进行全连接,考虑不同QP值的影响,并最终输出三个分支的分类结果,三个分支分别对应每个CTU中深度等级0,1,2,判断三个深度等级的CU是否继续划分或者停止划分。本发明一种基于多分支卷积神经网络的HEVC帧内预测方法能够有效地减少编码器计算开销,在保持编码性能基本不变的情况下,减少编码时间。