基于任务交互的轻量化目标检测方法和装置

    公开(公告)号:CN119723151A

    公开(公告)日:2025-03-28

    申请号:CN202411587471.7

    申请日:2024-11-08

    Applicant: 广州大学

    Abstract: 本申请公开了基于任务交互的轻量化目标检测方法和装置,方法包括:获取图像数据;将图像数据输入主干网络进行特征提取处理,得到图像基础特征数据;将图像基础特征数据输入颈部网络进行特征融合处理,得到图像融合特征数据;将图像融合特征数据输入任务交互轻量化结构进行任务交互处理,得到轻量化任务特征数据;轻量化任务特征数据包括分类任务特征和定位任务特征;将轻量化任务特征数据输入检测头进行预测,得到轻量化目标检测结果。本申请能够在减少模型参数量的同时保持较高的目标检测精度,可广泛应用于数据处理技术领域。

    一种基于边缘细化的伪装物体检测方法

    公开(公告)号:CN113468996B

    公开(公告)日:2023-07-11

    申请号:CN202110691277.3

    申请日:2021-06-22

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于边缘细化的伪装物体检测方法,首先,利用各类伪装物体的原始图像来构建伪装物体图像数据集,然后构建伪装物体检测网络,接着使用伪装物体图像数据集对构建的伪装物体检测网络进行迭代训练,该伪装物体检测网络将伪装物体检测任务分成两个阶段,第一阶段负责伪装物体检测,第二阶段负责细化伪装物体边缘;最后,以待预测的伪装物体原始图像作为训练完成后的伪装物体检测网络模型的输入,利用该伪装物体检测网络模型输出对应的有区分出图像背景和伪装物体的伪装图。本发明不仅能准确定位伪装物体,而且能保证伪装物体边缘的清晰,有效提高了伪装物体图像整体的检测精度。

    一种基于增强多模态对齐的广义零样本图像分类方法

    公开(公告)号:CN113139591A

    公开(公告)日:2021-07-20

    申请号:CN202110401006.X

    申请日:2021-04-14

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于增强多模态对齐的广义零样本图像分类方法,该方法包括以下步骤:图像获取步骤:获取待识别图像;图像分类步骤:将待识别图像输入广义零样本图像分类模型中确定待识别图像的识别目标类别;广义零样本图像分类模型为通过训练步骤和测试步骤得出;训练步骤具体包括:特征编码步骤:采用两个超球面变分自编码器分别对训练样本的视觉特征和语义特征编码进共享的潜层空间中;潜层向量对齐步骤:将训练模型的优化方向趋向于视觉潜层向量和语义潜层向量的分布对齐;分布边界阈值获取步骤:寻找分布边界阈值。本发明通过超球面变分自编码器为视觉特征和语义特征构建潜层空间,使不同类的相互远离,提高已见类和未见类的识别效果。

    基于最小二乘判别分析距离学习的行人重识别方法

    公开(公告)号:CN107909049B

    公开(公告)日:2020-07-31

    申请号:CN201711227802.6

    申请日:2017-11-29

    Applicant: 广州大学

    Abstract: 本发明公开了基于最小二乘判别分析距离学习的行人重识别方法,包括步骤:从两个监控摄像机中收集行人图像,进行归一化处理,提取视觉特征,组成训练样本集;对训练样本集进行目标点判别分析,计算出子空间投影矩阵,进行低维空间投影,计算每个行人的样本均值,得到低维目标点;对原始样本点采用线性回归的方法与相应的低维目标点进行逼近,得到代价函数;通过最小二乘的方法求解线性回归问题,得到投影矩阵,该投影矩阵与其转置的乘积得到马氏距离矩阵;根据马氏距离矩阵计算待查询行人与目标行人数据集特征向量的距离,得到候选查询图像,完成行人重识别任务。本发明能够提高行人重识别的准确性,提高了视频监控分析的工作效率。

    基于虚拟相机模型的车辆全景图像拼接外部参数估计方法

    公开(公告)号:CN108876719A

    公开(公告)日:2018-11-23

    申请号:CN201810271061.X

    申请日:2018-03-29

    Applicant: 广州大学

    Abstract: 本发明涉及基于虚拟相机模型的车辆全景图像拼接外部参数估计方法,包括步骤:(1)针对具体车辆建立虚拟相机模型,计算出虚拟相机模型的参数矩阵;将摄像头安装在车辆周围,在车身周围地面区域放置多个标记点;(2)每个摄像头拍摄一组含有标记点的图像,找出其对应的多个标记点在全景视野范围的坐标,并通过待求的外部参数矩阵将该坐标转化成当前相机坐标系下的坐标;(3)对原始图像进行畸变校正,找出标记点的图像坐标,并通过相机成像模型将其转化为对应相机坐标系下的坐标;将步骤(2)、(3)的坐标建立方程组,求解出每个摄像头的外部参数。本发明通过建立方程组得到每个摄像头外部参数的解析解简化了外部参数估计的步骤。

    一种基于LBP和Color特征的运动检测方法

    公开(公告)号:CN108711164A

    公开(公告)日:2018-10-26

    申请号:CN201810589563.7

    申请日:2018-06-08

    Applicant: 广州大学

    Abstract: 本发明提供了一种基于LBP和Color特征的运动检测方法,包括:获取视频文件的前N帧视频帧图片,并对视频帧图片的每个像素建立基于LBP和Color的背景模型,每个背景模型中包括N个背景样本;对N个背景样本按照权重降序排列,建立运动检测模型;将视频文件的像素与运动检测模型的背景样本进行LBP比较和Color比较,根据比较结果获得前景像素和背景像素;对背景像素的运动检测模型进行更新;对前景像素的背景模型中的背景样本进行更新;对所述前景像素和背景像素进行滤波;该方法能够有效提高运动检测的准确性。

    一种血液净化用计量装置和方法

    公开(公告)号:CN106902408A

    公开(公告)日:2017-06-30

    申请号:CN201710097091.9

    申请日:2017-02-22

    Applicant: 广州大学

    Inventor: 蒋顺忠 胡晓 李丽

    Abstract: 本发明公开了一种血液净化用计量装置,其包括壳体,所述壳体上设有球形或者椭球形的容置腔,所述容置腔内置有计量袋,所述计量袋包括通过隔膜分离且容积相等的第一囊体和第二囊体,所述第一囊体和第二囊体上分别设有液体进出口,所述液体进出口分别连接带有管路开关的导液管;所述容置腔内设有压力探测器。利用所述计量装置可实现被测液体的精确计量;由于除可一次性使用的计量袋外,计量装置的其他部件不与被测液体发生直接接触,避免相互感染,因此既可计量透析液,还可计量置换液和血液;所述计量装置结构简单,安装方便,可直接安装在其他设备的表面,方便操作。

    一种基于增强多模态对齐的广义零样本图像分类方法

    公开(公告)号:CN113139591B

    公开(公告)日:2023-02-24

    申请号:CN202110401006.X

    申请日:2021-04-14

    Applicant: 广州大学

    Abstract: 本发明公开了一种基于增强多模态对齐的广义零样本图像分类方法,该方法包括以下步骤:图像获取步骤:获取待识别图像;图像分类步骤:将待识别图像输入广义零样本图像分类模型中确定待识别图像的识别目标类别;广义零样本图像分类模型为通过训练步骤和测试步骤得出;训练步骤具体包括:特征编码步骤:采用两个超球面变分自编码器分别对训练样本的视觉特征和语义特征编码进共享的潜层空间中;潜层向量对齐步骤:将训练模型的优化方向趋向于视觉潜层向量和语义潜层向量的分布对齐;分布边界阈值获取步骤:寻找分布边界阈值。本发明通过超球面变分自编码器为视觉特征和语义特征构建潜层空间,使不同类的相互远离,提高已见类和未见类的识别效果。

    一种基于目标中心编码外观模型的行人重识别方法

    公开(公告)号:CN108596034B

    公开(公告)日:2021-05-11

    申请号:CN201810243227.7

    申请日:2018-03-23

    Applicant: 广州大学

    Inventor: 杨钊 彭绍湖 胡晓

    Abstract: 本发明公开了一种目标中心编码外观模型的行人重识别方法,包括步骤:分离行人图像的前景区域和背景区域,将仅包含前景区域的图像作为训练集;对图像的前景图像进行分块,对每一图像块进行视觉特征提取,采用局部约束稀疏编码进行特征表达,再通过空间金字塔聚合得到特征表示,作为图像的外观模型向量;将每一幅图像通过局部约束稀疏编码表示成相应的外观模型向量;然后在训练样本中选取一组匹配的行人图像和一组非匹配的行人图像,利用外观模型向量进行距离学习,以完成行人重识别。该方法从特征提取的角度出发,针对行人图像人体区域部分,提取视觉特征并进行局部约束稀疏编码,建立行人的外观模型,以提高行人重识别的准确性。

Patent Agency Ranking