-
公开(公告)号:CN113554084B
公开(公告)日:2024-03-01
申请号:CN202110806449.7
申请日:2021-07-16
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司 , 星宸科技股份有限公司
IPC分类号: G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/082
摘要: 本发明实例公开了一种基于剪枝和轻量卷积的车辆再辨识模型压缩方法及系统,对待压缩的车辆再辨识模型的骨干网络进行预训练,对预训练完毕的骨干网络进行剪枝,并通过重训练恢复精度,对车辆再辨识模型中特征金字塔模块进行轻量化卷积设计,将紧凑的骨干网络与轻量化的特征金字塔模块结合,骨干网络提取特征后,特征金字塔模块进行特征融合,得到基于特征金字塔联合表示的轻量化车辆再辨识模型。本发明以复杂高性能的车辆再辨识模型作为输入模型,其骨干网络中重要性较低的卷积核被自动选择和剪枝,并改进其特征金字塔模块中的卷积方式,有效降低参数量和计算量,产生精度相当但较为紧凑的模型。
-
公开(公告)号:CN113554084A
公开(公告)日:2021-10-26
申请号:CN202110806449.7
申请日:2021-07-16
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司 , 星宸科技股份有限公司
摘要: 本发明实例公开了一种基于剪枝和轻量卷积的车辆再辨识模型压缩方法及系统,对待压缩的车辆再辨识模型的骨干网络进行预训练,对预训练完毕的骨干网络进行剪枝,并通过重训练恢复精度,对车辆再辨识模型中特征金字塔模块进行轻量化卷积设计,将紧凑的骨干网络与轻量化的特征金字塔模块结合,骨干网络提取特征后,特征金字塔模块进行特征融合,得到基于特征金字塔联合表示的轻量化车辆再辨识模型。本发明以复杂高性能的车辆再辨识模型作为输入模型,其骨干网络中重要性较低的卷积核被自动选择和剪枝,并改进其特征金字塔模块中的卷积方式,有效降低参数量和计算量,产生精度相当但较为紧凑的模型。
-
公开(公告)号:CN118506168B
公开(公告)日:2024-10-15
申请号:CN202410954584.X
申请日:2024-07-17
申请人: 华侨大学 , 杭州电子科技大学 , 厦门亿联网络技术股份有限公司
IPC分类号: G06V10/98 , G06N3/045 , G06N3/0464 , G06T7/13 , G06V10/40 , G06V10/54 , G06V10/776 , G06V10/80 , G06V10/82 , G06V20/40
摘要: 本发明公开一种基于多重特征网络的沉浸式视频质量评价方法及装置,涉及图像处理领域,包括:在沉浸式视频质量评价模型中,通过视频预处理网络对待评价的沉浸式视频包含的多个视点的纹理视频和深度视频进行视点筛选,得到筛选后视点的纹理视频和深度视频,通过时空特征提取网络对筛选后视点的纹理视频和深度视频进行特征提取并计算得到对应视点的纹理视频的质量分数和深度视频的质量分数;通过权重计算网络计算得到筛选后视点的时空轨迹权重,将筛选后视点的时空轨迹权重与对应视点的纹理视频的质量分数和深度视频的质量分数输入质量分数计算模块计算得到沉浸式视频的质量分数。本发明解决现有沉浸式视频质量评价算法效果较差的问题。
-
公开(公告)号:CN114743128B
公开(公告)日:2024-08-09
申请号:CN202210225924.6
申请日:2022-03-09
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC分类号: G06V20/40 , G06V10/30 , G06N3/0464 , G06N3/08 , G06V10/774
摘要: 本发明公开了一种基于异种神经网络的多模态东北虎再辨识方法及装置,涉及机器视觉技术领域,可应用于跟踪东北虎的活动轨迹调查,对保护濒危的东北虎具有重大意义。本发明的异种神经网络包括用双分支残差神经网络和Transformer网络,其中,双分支残差卷积神经网络用于先对红外图像和可见光图像学习局部特征;Transformer网络对由双分支残差卷积神经网络学得的红外图像和可见光图像的局部特征,利用自注意力机制学习东北虎的全局特征。双分支残差卷积神经网络的各分支结构相同但参数独立,用于处理红外和可见光东北虎图像光谱、分辨率、对比度等特性;而Transformer网络从全局视角学习信息东北虎特征,减少图像模态差异带来的噪声影响,实现高准确率的东北虎再辨识。
-
公开(公告)号:CN114972812A
公开(公告)日:2022-08-30
申请号:CN202210624115.2
申请日:2022-06-02
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
摘要: 本发明提供一种基于结构相似度的非局部注意力学习方法,可广泛应用于机器视觉领域,例如图像分割、图像分类、图像识别等。现有非局部注意力方法简单计算不同空域位置的两个信号内积作为二者的相似度度量,并不完全符合人类视觉感知特点。针对这一问题,本发明提出利用结构相似度衡量不同空域位置的信号之间的相似度,在非局部注意力学习方法中充分考虑人类视觉对信号感知三个重要因素,即亮度、对比度和结构。其次,本发明进一步提出多尺度结构相似度度量策略,在不同尺度上更为全面地进行信号相似度度量。因此,本发明能够取得比现有非局部注意力方法更好地注意力学习效果。
-
公开(公告)号:CN114239730B
公开(公告)日:2024-08-20
申请号:CN202111564321.0
申请日:2021-12-20
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC分类号: G06F16/901 , G06N5/025 , G06F40/30 , G06V10/44 , G06F16/33 , G06F16/56 , G06N3/045 , G06N3/0464
摘要: 本发明公开了一种基于近邻排序关系的跨模态检索方法,包括:构建用于图像模态数据以及文本模态数据的深度语义特征提取的深度神经网络模型;将图像数据与文本数据对分别输入到所述深度神经网络模型中进行训练;结合近邻样本排序损失函数和语义相似度度量损失函数,计算语义对齐的损失值,通过训练缩小损失值,得到训练好的深度神经网络模型;通过训练好的深度神经网络模型提取到图像数据和文本数据间的公共语义表达,并将图像的深度语义特征与文本的深度语义特征转化到公共语义空间中,实现语义相似度的度量和检索。本发明方法能够有效地实现图像和文本两种不同模态数据间的跨模态检索。
-
公开(公告)号:CN116109880A
公开(公告)日:2023-05-12
申请号:CN202310088624.2
申请日:2023-02-09
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
摘要: 本发明提供一种鬼影方位视觉注意力学习方法。现有方位视觉注意力学习方法依赖卷积运算进行维度变换以及方位信息学习,计算和参数代价都较高。为此,本发明将轻量的鬼影模块耦合到方位视觉注意力学习方法中,设计降维鬼影模块轻量化压缩特征映射图,随后进行方位信息学习以节约计算和参数代价;设计去冗余鬼影模块降低特征映射图中的冗余信息,能改善特征质量。本发明作为一种新颖的视觉注意力机制有广泛应用,例如图像目标检测、图像目标识别、图像分割等。
-
公开(公告)号:CN114972812B
公开(公告)日:2024-06-18
申请号:CN202210624115.2
申请日:2022-06-02
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
IPC分类号: G06V10/74 , G06N3/0464 , G06N3/08
摘要: 本发明提供一种基于结构相似度的非局部注意力学习方法,可广泛应用于机器视觉领域,例如图像分割、图像分类、图像识别等。现有非局部注意力方法简单计算不同空域位置的两个信号内积作为二者的相似度度量,并不完全符合人类视觉感知特点。针对这一问题,本发明提出利用结构相似度衡量不同空域位置的信号之间的相似度,在非局部注意力学习方法中充分考虑人类视觉对信号感知三个重要因素,即亮度、对比度和结构。其次,本发明进一步提出多尺度结构相似度度量策略,在不同尺度上更为全面地进行信号相似度度量。因此,本发明能够取得比现有非局部注意力方法更好地注意力学习效果。
-
公开(公告)号:CN118506168A
公开(公告)日:2024-08-16
申请号:CN202410954584.X
申请日:2024-07-17
申请人: 华侨大学 , 杭州电子科技大学 , 厦门亿联网络技术股份有限公司
IPC分类号: G06V10/98 , G06N3/045 , G06N3/0464 , G06T7/13 , G06V10/40 , G06V10/54 , G06V10/776 , G06V10/80 , G06V10/82 , G06V20/40
摘要: 本发明公开一种基于多重特征网络的沉浸式视频质量评价方法及装置,涉及图像处理领域,包括:在沉浸式视频质量评价模型中,通过视频预处理网络对待评价的沉浸式视频包含的多个视点的纹理视频和深度视频进行视点筛选,得到筛选后视点的纹理视频和深度视频,通过时空特征提取网络对筛选后视点的纹理视频和深度视频进行特征提取并计算得到对应视点的纹理视频的质量分数和深度视频的质量分数;通过权重计算网络计算得到筛选后视点的时空轨迹权重,将筛选后视点的时空轨迹权重与对应视点的纹理视频的质量分数和深度视频的质量分数输入质量分数计算模块计算得到沉浸式视频的质量分数。本发明解决现有沉浸式视频质量评价算法效果较差的问题。
-
公开(公告)号:CN116128779A
公开(公告)日:2023-05-16
申请号:CN202211687228.3
申请日:2022-12-27
申请人: 华侨大学 , 厦门亿联网络技术股份有限公司
摘要: 本发明涉及一种适用于跨模态行人再辨识的随机置色数据增强方法,先对可见光图像随机裁剪局部区域,对所裁剪的局部区域进行随机灰度化变换,以及对红外光图像随机裁剪局部区域,对所裁剪的局部区域进行随机彩色化变换;再将变换后的局部区域替换为原先被裁剪区域,获取随机置色增强可见光和红外光图像用于跨模态行人再辨识步骤。本发明在图像层面上,以轻量计算代价缓解可见光和红外光图像风格差异,从而提升跨模态行人再辨识模型对模态变化的适应能力,进而提升跨模态行人再辨识的准确性。
-
-
-
-
-
-
-
-
-