-
公开(公告)号:CN117294894A
公开(公告)日:2023-12-26
申请号:CN202311150398.2
申请日:2023-09-07
申请人: 华侨大学
摘要: 本发明提供一种视频目标编辑方法、终端设备及存储介质,方法包括:获取视频信息、目标编辑操作、目标编号和视频目标参数;使用视频实例分割算法对视频中的帧图像进行目标分割,得到目标的像素级信息;输出对应操作和编号的相应图片列表,根据目标编辑操作,输出原帧列表、目标二值掩码列表、平移目标帧列表、平移目标二值掩码列表、缩放目标帧列表或缩放目标二值掩码列表;使用视频图像修复算法对视频画面进行修复,根据目标编辑操作,输出删除修复视频、平移修复视频列表或缩放修复视频。本发明能够更方便、高效及精确地实现视频目标编辑。
-
公开(公告)号:CN117274253A
公开(公告)日:2023-12-22
申请号:CN202311546437.0
申请日:2023-11-20
申请人: 华侨大学
IPC分类号: G06T7/00 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/80
摘要: 本发明公开了一种基于多模态Transformer的零配件检测方法、装置及可读介质,涉及图像处理领域,包括:获取零配件的重量以及不同角度零配件图像叠加得到输入图像;构建零配件检测模型并训练,得到经训练的零配件检测模型,将输入图像和重量输入经训练的零配件检测模型,得到特征向量;建立包含已知型号的零配件的特征向量的零配件特征向量数据库;将待检测的零配件的输入图像和重量输入经训练的零配件检测模型,得到待检测的零配件的特征向量,将待检测的零配件的特征向量与零配件特征向量数据库中的特征向量进行比对,检测得到待检测的零配件的型号,解决传统的图像检测方法使用单一类型的数据对零配件型号检测的准确性差等问题。
-
公开(公告)号:CN116739903A
公开(公告)日:2023-09-12
申请号:CN202310793797.4
申请日:2023-06-30
申请人: 华侨大学
IPC分类号: G06T3/40 , G06V10/764 , G06V10/42 , G06V10/774
摘要: 本发明公开了一种结合分类加强与细化微调的目标跟踪方法、装置及可读介质,构建目标跟踪网络模型并训练,得到经训练的目标跟踪网络模型,将当前帧输入ResNet模块,将ResNet模块的输出特征输入全局感知模块,得到全局感知特征,将全局感知特征与模板帧输入分类加强模块,得到前景特征图和前景概率特征图;在第一分支中,将降维后的全局感知特征与模板帧输入判别相关滤波器,得到定位特征图;在第二分支中,将前景特征图、前景概率特征图和定位特征图融合得到混合特征图,将混合特征图与ResNet模块的部分输出特征输入微调路径模块,得到目标的掩膜,通过拟合掩膜,得到矩形框,细化微调模块根据矩形框提取目标的特征,并与模板帧做逐像素相关,得到目标跟踪框。
-
公开(公告)号:CN116708687A
公开(公告)日:2023-09-05
申请号:CN202310522131.5
申请日:2023-05-10
申请人: 华侨大学
IPC分类号: H04N1/32 , H04N19/182 , H04N19/593
摘要: 本发明提供一种基于高位位平面预测的图像压缩与可逆数据隐藏方法,包括:图像所有者基于像素预测值和高位位平面预测完成图像无损压缩,以及将辅助数据嵌入数据嵌入空间;图像解压方解压缩并恢复高位位平面数据后可无损恢复原始图像;云端数据嵌入者根据密钥可以提取辅助数据并定位预留的数据嵌入空间,进而完成数据嵌入得到载密加密图像;授权接收者根据拥有的密钥权限可正确提取嵌入数据或无损恢复原始图像。本发明既能实现图像无损压缩与解压缩,也能实现加密图像大容量的可逆信息隐藏,进一步加强了图像内容的保护。
-
公开(公告)号:CN116612445A
公开(公告)日:2023-08-18
申请号:CN202310891062.5
申请日:2023-07-20
申请人: 华侨大学
IPC分类号: G06V20/54 , G06V10/762 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/778 , G06V10/82 , G06N3/088
摘要: 本发明公开了一种基于自适应聚类和困难样本加权的无监督车辆再辨识方法,首先,利用当前聚类参数计算最合适的半径值,提升聚类伪标签对车辆样本噪声的鲁棒性;其次,记忆模块记录所有车辆样本特征向量,利用距离作为车辆样本困难程度加权依据,改善模型对困难车辆样本关注力不足的问题;最后,利用加权困难车辆样本结合对比学习方法训练车辆再辨识模型。本发明可广泛应用于智慧交通和智慧安防中的智能视频监控系统。
-
公开(公告)号:CN116612439A
公开(公告)日:2023-08-18
申请号:CN202310891061.0
申请日:2023-07-20
申请人: 华侨大学
IPC分类号: G06V20/52 , G06V40/10 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种模态域适应性和特征鉴别性平衡方法及行人再辨识方法,其中的模态域适应性和特征鉴别性平衡方法用于红外光与可见光跨模态行人再辨识。本发明在模态域适应性优化和特征鉴别性优化之间设置一个注意力模块,用模态域适应性优化函数监督注意力模块的掩码学习,并用特征鉴别性优化函数监督注意力模块的反掩码学习,从而借助注意力机制自动平衡模态域适应性和特征鉴别性之间的矛盾,改善特征学习效果,提升红外光与可见光跨模态行人再辨识准确性。本发明可以应用于智能视频监控系统中的行人身份识别、行人轨迹分析等,具有广泛的应用价值。
-
公开(公告)号:CN116128779A
公开(公告)日:2023-05-16
申请号:CN202211687228.3
申请日:2022-12-27
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
摘要: 本发明涉及一种适用于跨模态行人再辨识的随机置色数据增强方法,先对可见光图像随机裁剪局部区域,对所裁剪的局部区域进行随机灰度化变换,以及对红外光图像随机裁剪局部区域,对所裁剪的局部区域进行随机彩色化变换;再将变换后的局部区域替换为原先被裁剪区域,获取随机置色增强可见光和红外光图像用于跨模态行人再辨识步骤。本发明在图像层面上,以轻量计算代价缓解可见光和红外光图像风格差异,从而提升跨模态行人再辨识模型对模态变化的适应能力,进而提升跨模态行人再辨识的准确性。
-
公开(公告)号:CN115995065A
公开(公告)日:2023-04-21
申请号:CN202310149452.5
申请日:2023-02-22
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC分类号: G06V20/54 , G06V10/82 , G06N3/08 , G06N3/0464
摘要: 本发明提供一种基于动态卷积Transformer的车辆再辨识方法;不同于各个局部区域共用卷积核,本发明中各个局部区域共用一个卷积核池,由一个全连接人工神经子网从各个局部区域各自学习得到一组系数,利用各个局部区域对应的系数将卷积核池中的卷积核进行线性融合获得各个局部区域的专用卷积核,用于学习各个局部区域的特征。因此,本发明能够根据各个局部区域自身的表征特性自适应学习相应的卷积核,能够更好学习车辆图像的局部特征,从而有利于提升车辆再辨识性能。
-
公开(公告)号:CN112818135B
公开(公告)日:2022-11-01
申请号:CN202110208342.2
申请日:2021-02-24
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
摘要: 本发明公开了一种基于公共语义空间学习构建图文知识图谱方法,包括如下步骤:构建深度神经网络用于图像与文本数据的深度特征提取;将图像与文本数据对oi=(xi,li,yi)分别输入到深度神经网络中训练;其中oi表示第i对图像‑文本对数据以及对应的标签,xi,yi与li分别表示第i个图像数据、文本数据以及对应的标签数据;通过损失函数学习两种图像和文本数据间的公共语义表达,并将图像与文本特征转化到公共语义空间中;根据相似度度量,依据CN‑DBpedia的构建方法构建知识图谱。本发明提供的方法能有效实现图像、文本两种不同的模态间的知识图谱构建。
-
公开(公告)号:CN109996084B
公开(公告)日:2022-11-01
申请号:CN201910361446.X
申请日:2019-04-30
申请人: 华侨大学
IPC分类号: H04N19/59 , H04N19/119 , H04N19/14 , G06N3/04 , G06N3/08
摘要: 本发明涉及一种基于多分支卷积神经网络的HEVC帧内预测方法,属于视频编码领域,本方法使用多分支卷积神经网络,对每个CTU进行预处理,并分别作为不同分支的卷积神经网络的输入,经过卷积计算之后,将得到的特征进行全连接,考虑不同QP值的影响,并最终输出三个分支的分类结果,三个分支分别对应每个CTU中深度等级0,1,2,判断三个深度等级的CU是否继续划分或者停止划分。本发明一种基于多分支卷积神经网络的HEVC帧内预测方法能够有效地减少编码器计算开销,在保持编码性能基本不变的情况下,减少编码时间。
-
-
-
-
-
-
-
-
-