-
公开(公告)号:CN115546742A
公开(公告)日:2022-12-30
申请号:CN202211323105.1
申请日:2022-10-27
Applicant: 华南农业大学
Abstract: 本发明涉及一种基于单目热红外摄像头的铁轨异物识别方法及系统。包括:在传统的半自动标注算法基础上利用了多种不同网络模型进行半自动标注,获得带有更为精确的半自动图像轮廓信息;在语义分割网络中,将热感图像特征图和基于热感图像灰度处理的特征图进行融合,并增加了权重因子规格化模块操作,获得异物分割图;提出基于改进的跨模态融合的主干神经网络,通过transformer将分割图和热红外图的跨模态特征点和模态信息进行融合,利用蒸馏学习方法压缩网络参数实现了轻量级的异物识别;提出一种监控报警设备,用于监控和报警铁轨异物入侵;本发明提高了在各种环境下铁轨异物识别的效率和准确度,能够有效降低异物入侵铁轨造成列车事故的可能性。
-
公开(公告)号:CN114240789A
公开(公告)日:2022-03-25
申请号:CN202111569108.9
申请日:2021-12-21
Applicant: 华南农业大学
Abstract: 本发明涉及一种基于优化的保持亮度的红外图像直方图均衡增强方法,包括以下步骤:S1、采用自适应曝光率和模糊率的阈值选取方法选取原始红外图像阈值,并以该阈值为标准将原始图像划分成两个子图;S2、将灰度值大于阈值的子图进行限制对比度自适应直方图均衡处理;S3、将灰度值小于阈值的子图进行基于自适应亮度的暗通道先验算法的HSV颜色空间转换增强处理;S4、将处理后的两个子图进行融合形成效果图。本发明不仅提高了热红外图像增强质量,在能够有效保持细节信息的前提下,适用于低照度、高亮度红外图像,还能降低噪声,使得红外图像细节更加突显,更加地接近真实影像。
-
公开(公告)号:CN110674779A
公开(公告)日:2020-01-10
申请号:CN201910943722.3
申请日:2019-09-30
Applicant: 华南农业大学
Abstract: 本发明公开了一种基于特征融合的单目远红外行人检测方法,包括以下步骤:对原始红外图像按不同比例进行缩放,得到相应的缩放红外图像;对缩放红外图像使用局部自适应双阈值分割二值化;将得到的二值图进行形态学处理;搜索处理后的二值图,并进行过滤,得到初步候选区域(ROIs);将初步ROIs进行滑窗,得到一系列滑窗ROIs;对ROIs计算特征值,再进行归一化处理后输入第一个支持向量机(SVM)分类器和第二个SVM个分类器级联进行决策,得到初步行人检测框;调用非极大值抑制算法对初步行人检测框进行计算,得到最终行人检测框;本发明能适应不同距离检测,克服行人图像断裂情况,且提高了行人检测准确性。
-
公开(公告)号:CN118486084A
公开(公告)日:2024-08-13
申请号:CN202410712645.1
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V40/20 , G06V20/40 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0985 , G06N3/048
Abstract: 本发明公开了一种基于Multi‑YOWO的人体行为识别方法,该方法包括:通过采集得到的RGB视频数据生成骨骼热图组,根据骨骼热图组的活动区域对RGB关键帧进行裁剪;将获取得到的骨骼热图组和RGB关键帧输入到Multi‑YOWO模型中获得人体行为识别结果。Multi‑YOWO模型具体指将YOWO的3D主干网络3D‑ResNet替换为DC‑PoseC3D网络,其中DC‑PoseC3D网络是通过将ResNet模块中的1×1×1conv、1×3×3conv、1×1×1conv依次替换为1×1×1GSconv、1×3×3DC‑GSconv、1×1×1GSconv,并且在1×1×1GSconv之后增加SA注意力模块所得,其中DC‑GSconv是通过将GSconv中的普通卷积替换为分组且空洞率不同的空洞卷积所得。
-
公开(公告)号:CN118485946A
公开(公告)日:2024-08-13
申请号:CN202410712286.X
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V20/40 , G06V20/52 , G06V10/44 , G06V10/42 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/088
Abstract: 本发明公开了一种基于局部‑全局存储器U‑Net的视频异常检测算法。该算法首先采集正常和异常的视频,并对视频进行预处理以得到训练样本。然后,通过U‑Net的编码器将训练样本进行编码得到特征图,将特征图输入到局部‑全局存储器中进行查询,同时根据查询分数来更新局部和全局存储器。接着,通过U‑Net的解码器将特征图重构为预测帧,并进行自适应误差矫正。最后,通过最小化正常数据的重建损失,将视频序列输入到包含局部‑全局存储器的U‑Net深度神经网络中判断是否发生异常事件。本发明通过局部‑全局存储器保存了正常视频序列的局部和全局信息的正常原型,提高了深度神经网络对异常事件的识别能力,通过自适应误差纠正模块,缓解了存储器的累计误差缺陷,有效提高了异常检测的鲁棒性和稳定性。
-
公开(公告)号:CN110363095B
公开(公告)日:2023-07-04
申请号:CN201910536393.0
申请日:2019-06-20
Applicant: 华南农业大学
IPC: G06V30/412 , G06V30/413 , G06V30/22 , G06V30/164 , G06V30/146
Abstract: 本发明公开的一种针对表格字体的识别方法,包括以下步骤:获取表格图像,对表格图像进行预处理,包括:图像灰度化、图像去噪、图像倾斜校正;然后进行表格提取,提取表格横线、提取表格竖线、合并表格线段,去除不合格的表格线,得到完整表格;对完整表格进行定位截取,获取表格内容在完整表格中的定位;对定位截取内容进行表格内容提取,获取表格内容;使用识别技术对表格内容进行识别,得到初步识别结果,并分别训练对应的语言库,使用对应的语言库对初步识别结果进行选举,得到最终识别结果;本发明能够对多种格式的表格进行准确定位提取表格线和表格结构,能避免虚线和细线的对表格提取的干扰,能同时对印刷体和手写体进行准确识别。
-
公开(公告)号:CN114842397B
公开(公告)日:2023-04-07
申请号:CN202210556212.2
申请日:2022-05-19
Applicant: 华南农业大学
IPC: G06V20/40 , G06V40/20 , G06V10/764 , G06V10/80 , G06V10/82 , G06T7/136 , G06T7/269 , G06T7/73 , G06T7/62 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明公开一种基于异常检测的实时老人跌倒检测方法,检测前,进行数据集人工构造与半自动标注。完成网络训练后,拍摄红外图像,将红外图像转化为光流图。将每张红外图与对应光流图叠加,共同输入到状态检测网络中检测老人位置与状态,并使用卡尔曼滤波实现跟踪。其中,目标检测网络预测老人可能的状态,当老人发生状态切换时,表明发现了一个可疑跌倒动作,触发动作识别网络。然后,选取发生状态切换的视频序列输入到动作识别网络进一步确认。最后,根据异常分数判断该次动作是否为跌倒事件,若是则发出警报,否则排除虚警。本发明设计了状态识别网络和动作识别网络,结合异常检测原理和状态动作联合策略,实现室内老人全天实时跌倒检测。
-
公开(公告)号:CN114842397A
公开(公告)日:2022-08-02
申请号:CN202210556212.2
申请日:2022-05-19
Applicant: 华南农业大学
IPC: G06V20/40 , G06V40/20 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06T7/136 , G06T7/269 , G06T7/73 , G06T7/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于异常检测的实时老人跌倒检测方法,检测前,进行数据集人工构造与半自动标注。完成网络训练后,拍摄红外图像,将红外图像转化为光流图。将每张红外图与对应光流图叠加,共同输入到状态检测网络中检测老人位置与状态,并使用卡尔曼滤波实现跟踪。其中,目标检测网络预测老人可能的状态,当老人发生状态切换时,表明发现了一个可疑跌倒动作,触发动作识别网络。然后,选取发生状态切换的视频序列输入到动作识别网络进一步确认。最后,根据异常分数判断该次动作是否为跌倒事件,若是则发出警报,否则排除虚警。本发明设计了状态识别网络和动作识别网络,结合异常检测原理和状态动作联合策略,实现室内老人全天实时跌倒检测。
-
公开(公告)号:CN119107484A
公开(公告)日:2024-12-10
申请号:CN202411062384.X
申请日:2024-08-05
Applicant: 华南农业大学
IPC: G06V10/764 , G06V10/80 , G06V10/74 , G06N3/0455 , G06N3/0464 , G06N3/084
Abstract: 本发明设计了一种基于深度学习的零样本图像目标检测方法,属于基于大模型的图像目标检测领域。本发明设计的视觉语言模型包含RO‑Yolo‑Backbone、HWD‑RepVL‑PAN、MCJ‑Text Contrastive Head和回归边界框目标检测模块,通过对卷积核参数共享、感受野范围的优化,增强特征提取能力,利用小波变换减少下采样纹理损失,引入多距离公式弱化类内差异和增强类间差异,旨在有效提升大数据时代下的零样本图像目标检测能力。
-
公开(公告)号:CN118506245A
公开(公告)日:2024-08-16
申请号:CN202410712244.6
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V20/40 , G06V10/44 , G06V10/42 , G06V10/62 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于STMUnet的视频异常检测算法。本发明针对基于帧预测的视频异常检测算法的时间和空间的强相关性提出了STMUnet网络,该网络利用了Unet网络优秀的重构能力又结合了本发明时空转换模块的时空建模能力;为了加强网络对正常视频帧的重构能力而又抑制异常视频帧的重构能力,本发明在Unet网络的原始解码器D的倒数第二个上采样后插入了一个自监督掩码卷积Transformer方差模块SSMCTVB(Self‑Supervised Masked Convolutional Transformer Variance Block for Anomaly Detection),该模块使用掩码卷积将局部特征信息整合为全局特征信息,同时融合方差注意力与Transformer通道注意力,以加强网络对异常帧的区分能力。本发明基于STMUnet的视频异常检测算法具有泛化性强、精度高的特点。
-
-
-
-
-
-
-
-
-