-
公开(公告)号:CN119478442A
公开(公告)日:2025-02-18
申请号:CN202411576560.1
申请日:2024-11-06
Applicant: 华南农业大学
IPC: G06V10/44 , G06V10/40 , G06V40/10 , G06V10/82 , G06V10/77 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/084
Abstract: 本发明公开一种改进的YOLOv7人体关键点检测方法,该方法通过LabelImage进行手动标注获得丰富的训练样本;将YOLOv7中原有的MP模块替换为L‑MP模块改进特征提取,新增LiftDown Pool分支和残差连接;在YOLOv7网络的Backbone模块和Head模块之间新增EDH‑Conv模块,利用其输出作为空间权重分布来矫正激活区域,进一步提升了网络对小目标的检测能力;增加改进的RSwin Transformer编码器,用于提升对复杂场景中小目标和重叠目标的检测效果;将损失函数参照Wise‑IoU LOSS改为基于L2损失的改进关键点检测损失,并引入用于调整关键点误差权重的动态聚焦机制,加速模型的收敛。该方法增强了对于复杂场景下的人体关键点检测识别能力,对于体育运动中人体关键点检测识别与计数任务有更强的鲁棒性、准确率和效率。
-
公开(公告)号:CN118485947A
公开(公告)日:2024-08-13
申请号:CN202410712382.4
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V20/40 , G06V20/52 , G06V10/44 , G06V10/42 , G06V10/62 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/0455 , G06N3/0985 , G06N3/0895 , G06N3/048
Abstract: 本发明公开了一种基于特征解耦的弱监督视频异常检测方法。该方法首先采集正常和异常视频构建训练数据集,然后利用预训练的视觉‑语言模型获取视频和文本标签的嵌入表示。接着,通过构建局部‑全局时间模块,将视频特征分别从局部和全局的时间依赖性进行建模,以更好地捕获视频中的时间信息。此外,通过特征解耦模块将视频特征和文本标签的共享特征有效地解耦,并将文本标签的共享特征融入到视频特征中,以增强视频特征的表示能力。最后,通过构建分类网络和使用多实例学习方法训练整个神经网络,实现对视频异常事件的准确检测。本发明通过局部‑全局时间模块的设计,有效地捕获了视频数据中的时间依赖,并通过特征解耦模块将视频特征与文本标签特征进行有效地解耦,通过将视频特征和文本标签共享特征的有效融合,提高了视频特征的表示能力。
-
公开(公告)号:CN114387484B
公开(公告)日:2024-04-16
申请号:CN202210026630.0
申请日:2022-01-11
Applicant: 华南农业大学
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06V10/25 , G06V40/16 , G06V20/40 , G06V20/52 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于yolov4改进的口罩佩戴检测方法,针对三个方面进行改进,实现了对口罩的实时鲁棒检测;首先,在数据预处理过程中,利用椒盐噪声以及修改的对数函数相结合对初始图像进行数据增强操作;然后在主干(BackBone)中对CBM(Conv+BN+Mish),CBL(Conv+BN+Leaky relu)组件将原本的激活函数mish()函数替换为三段式分段激活函数;最后,对存在于YOLOv4中主干和检测器的激活函数mish进行改进,利用支持向量机函数代替原类别损失中的二元交叉熵损失函数;本发明改善了YOLOv4算法的效率,提升了对暗光环境的检测准确性,降低了过拟合。
-
公开(公告)号:CN117253154A
公开(公告)日:2023-12-19
申请号:CN202311434817.5
申请日:2023-11-01
Applicant: 华南农业大学
IPC: G06V20/10 , G06V10/20 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于深度学习的集装箱弱小序列号目标检测识别方法,该方法对数据集通过PPOCRLabel完成半自动标注和LabelImage进行手动标注并进行Mosaic‑6数据增强获得丰富的训练样本;加入替代YOLOv5s中CSP模块的Swin‑Transformer编码器改进特征提取,引入深度可分离卷积层,提取更为充分的全局上下文特征;改进YOLOv5s中颈部网络模块的特征融合网络,并将颈部网络的Upsample层改为CARAFE,提升对微小尺度特征映射的融合能力;增加微小尺度检测头Transformer Prediction Head,引入BiFormer注意力机制层,针对性增强细粒度的细节;将损失函数CIOU LOSS换为EIOU LOSS,稳定模型的权重集。该方法增强了对于自然场景下的矩形文本框弱小目标检测识别能力,对于集装箱弱小序列号目标检测识别任务有更强的鲁棒性、准确率和效率。
-
公开(公告)号:CN108062355B
公开(公告)日:2020-07-31
申请号:CN201711179719.6
申请日:2017-11-23
Applicant: 华南农业大学
IPC: G06F16/33 , G06F16/338
Abstract: 本发明公开了一种基于伪反馈与TF‑IDF的查询词扩展方法,该方法主要通过科学的查询约束词选取,通过本发明提出的两次筛选得到最终可用来做查询词扩展的词,然后通过本发明提出的打分公式为文档进行打分和排序操作。本发明的特色在于提出了一种新的查询约束词选取方式以及候选词的选取方式,并做了两次筛选操作去除无关词。还结合了传统的BM25打分公式,发明一个新的专为查询词扩展的新打分公式,能够更加科学的将查询词扩展后的结果文档进行打分,从而得出更科学的搜索排序结果。
-
公开(公告)号:CN110363095A
公开(公告)日:2019-10-22
申请号:CN201910536393.0
申请日:2019-06-20
Applicant: 华南农业大学
Abstract: 本发明公开的一种针对表格字体的识别方法,包括以下步骤:获取表格图像,对表格图像进行预处理,包括:图像灰度化、图像去噪、图像倾斜校正;然后进行表格提取,提取表格横线、提取表格竖线、合并表格线段,去除不合格的表格线,得到完整表格;对完整表格进行定位截取,获取表格内容在完整表格中的定位;对定位截取内容进行表格内容提取,获取表格内容;使用识别技术对表格内容进行识别,得到初步识别结果,并分别训练对应的语言库,使用对应的语言库对初步识别结果进行选举,得到最终识别结果;本发明能够对多种格式的表格进行准确定位提取表格线和表格结构,能避免虚线和细线的对表格提取的干扰,能同时对印刷体和手写体进行准确识别。
-
公开(公告)号:CN114926456B
公开(公告)日:2025-02-25
申请号:CN202210669222.7
申请日:2022-06-14
Applicant: 华南农业大学
IPC: G06T7/00 , G06V10/25 , G06V10/26 , G06V10/28 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种半自动标注和改进深度学习的铁轨异物检测方法,包括:基于热红外人体分割结果,半自动标注数据集;针对铁轨户外全天候环境,对ResNet 50神经网络进行改进完成对不同环境场景的识别;根据场景识别的结果,对YOLOv5神经网络进行改进,识别铁轨异物;对图片进行铁轨轮廓提取,结合异物位置,设计了针对铁轨异物入侵的报警策略,进行分等级的报警判断。通过引入深度学习的场景分类结合改进的目标识别网络,本发明提高了不同环境场景下的铁轨异物识别的效果,提升了对异物入侵铁轨报警的精准度,结合科学的报警策略,降低了异物入侵铁轨造成列车事故的可能性。
-
公开(公告)号:CN118982843A
公开(公告)日:2024-11-19
申请号:CN202411062312.5
申请日:2024-08-05
Applicant: 华南农业大学
IPC: G06V40/10 , G06V10/26 , G06T5/50 , G06V10/764 , G06V10/774 , G06T5/77 , G06T3/4007 , G06N3/048 , G06N3/0464 , G06N3/084
Abstract: 本发明公开一种基于深度学习的轻量型恶劣环境下行人检测方法,该方法包括以下步骤:(1)采集复杂道路场景下的多模态数据进行预处理和标注;(2)通过DIVFusion对采集的多模态数据进行融合以得到融合数据;(3)对融合数据进行曝光校正与降噪;(4)改进YOLO‑MS检测网络;(5)利用训练出的改进YOLO‑MS检测模型完成行人检测;该方法采用可见光与红外融合的技术,设计了语义分割模块、降噪模块和轻量型的检测模块,对于恶劣环境下的行人检测有较大的提升,尤其是对于黑暗环境和如雨、雪、雾等复杂环境下的行人检测。
-
公开(公告)号:CN118710931A
公开(公告)日:2024-09-27
申请号:CN202410713133.7
申请日:2024-06-04
Applicant: 华南农业大学
IPC: G06V10/62 , G06V10/25 , G06V40/20 , G06V20/40 , G06V10/26 , G06V20/70 , G06V10/44 , G06V10/42 , G06V10/52 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/084 , G06N3/094 , G06N3/048
Abstract: 本发明公开一种基于基于改进SiamFC的人体头肩小目标跟踪方法,该方法对数据集通过背景差分算法完成半自动标注,并使用LabelImage进行手动标注获得丰富的训练样本;引入改进的通道注意力机制SE模块改进特征提取,从而构建SEMC特征提取模块;构建ASPP‑M多尺度空洞卷积模块,基于ASPP模块增加LEDIO模块进行多尺度卷积的预处理,引入SURF‑PCA模块和拉普拉斯滤波器与多尺度特征图进行特征融合;改进SiamFC主干网络AlexNet特征提取模块,引入混合高斯模型进行背景建模,引入SEMC模块和ASPP‑M模块,引入激活函数Relu和LRN局部归一,并增加残差连接。该方法增强了在复杂场景下人体头肩目标的跟踪能力;缓解网络训练时可能出现的梯度消失情形。
-
公开(公告)号:CN110674779B
公开(公告)日:2023-06-20
申请号:CN201910943722.3
申请日:2019-09-30
Applicant: 华南农业大学 , 广州飒特红外科技有限公司 , 广州飒特红外股份有限公司
IPC: G06V20/58 , G06V10/34 , G06V10/26 , G06V10/764 , G06V10/25 , G06V10/50 , G06V10/44 , G06V10/54 , G06V10/774 , G06V10/80 , G06V40/10
Abstract: 本发明公开了一种基于特征融合的单目远红外行人检测方法,包括以下步骤:对原始红外图像按不同比例进行缩放,得到相应的缩放红外图像;对缩放红外图像使用局部自适应双阈值分割二值化;将得到的二值图进行形态学处理;搜索处理后的二值图,并进行过滤,得到初步候选区域(ROIs);将初步ROIs进行滑窗,得到一系列滑窗ROIs;对ROIs计算特征值,再进行归一化处理后输入第一个支持向量机(SVM)分类器和第二个SVM个分类器级联进行决策,得到初步行人检测框;调用非极大值抑制算法对初步行人检测框进行计算,得到最终行人检测框;本发明能适应不同距离检测,克服行人图像断裂情况,且提高了行人检测准确性。
-
-
-
-
-
-
-
-
-