一种改进的YOLOv7人体关键点检测方法

    公开(公告)号:CN119478442A

    公开(公告)日:2025-02-18

    申请号:CN202411576560.1

    申请日:2024-11-06

    Abstract: 本发明公开一种改进的YOLOv7人体关键点检测方法,该方法通过LabelImage进行手动标注获得丰富的训练样本;将YOLOv7中原有的MP模块替换为L‑MP模块改进特征提取,新增LiftDown Pool分支和残差连接;在YOLOv7网络的Backbone模块和Head模块之间新增EDH‑Conv模块,利用其输出作为空间权重分布来矫正激活区域,进一步提升了网络对小目标的检测能力;增加改进的RSwin Transformer编码器,用于提升对复杂场景中小目标和重叠目标的检测效果;将损失函数参照Wise‑IoU LOSS改为基于L2损失的改进关键点检测损失,并引入用于调整关键点误差权重的动态聚焦机制,加速模型的收敛。该方法增强了对于复杂场景下的人体关键点检测识别能力,对于体育运动中人体关键点检测识别与计数任务有更强的鲁棒性、准确率和效率。

    一种基于特征解耦的弱监督视频异常检测方法

    公开(公告)号:CN118485947A

    公开(公告)日:2024-08-13

    申请号:CN202410712382.4

    申请日:2024-06-04

    Abstract: 本发明公开了一种基于特征解耦的弱监督视频异常检测方法。该方法首先采集正常和异常视频构建训练数据集,然后利用预训练的视觉‑语言模型获取视频和文本标签的嵌入表示。接着,通过构建局部‑全局时间模块,将视频特征分别从局部和全局的时间依赖性进行建模,以更好地捕获视频中的时间信息。此外,通过特征解耦模块将视频特征和文本标签的共享特征有效地解耦,并将文本标签的共享特征融入到视频特征中,以增强视频特征的表示能力。最后,通过构建分类网络和使用多实例学习方法训练整个神经网络,实现对视频异常事件的准确检测。本发明通过局部‑全局时间模块的设计,有效地捕获了视频数据中的时间依赖,并通过特征解耦模块将视频特征与文本标签特征进行有效地解耦,通过将视频特征和文本标签共享特征的有效融合,提高了视频特征的表示能力。

    一种基于深度学习的集装箱弱小序列号目标检测识别方法

    公开(公告)号:CN117253154A

    公开(公告)日:2023-12-19

    申请号:CN202311434817.5

    申请日:2023-11-01

    Abstract: 本发明公开一种基于深度学习的集装箱弱小序列号目标检测识别方法,该方法对数据集通过PPOCRLabel完成半自动标注和LabelImage进行手动标注并进行Mosaic‑6数据增强获得丰富的训练样本;加入替代YOLOv5s中CSP模块的Swin‑Transformer编码器改进特征提取,引入深度可分离卷积层,提取更为充分的全局上下文特征;改进YOLOv5s中颈部网络模块的特征融合网络,并将颈部网络的Upsample层改为CARAFE,提升对微小尺度特征映射的融合能力;增加微小尺度检测头Transformer Prediction Head,引入BiFormer注意力机制层,针对性增强细粒度的细节;将损失函数CIOU LOSS换为EIOU LOSS,稳定模型的权重集。该方法增强了对于自然场景下的矩形文本框弱小目标检测识别能力,对于集装箱弱小序列号目标检测识别任务有更强的鲁棒性、准确率和效率。

    基于伪反馈与TF-IDF的查询词扩展方法

    公开(公告)号:CN108062355B

    公开(公告)日:2020-07-31

    申请号:CN201711179719.6

    申请日:2017-11-23

    Abstract: 本发明公开了一种基于伪反馈与TF‑IDF的查询词扩展方法,该方法主要通过科学的查询约束词选取,通过本发明提出的两次筛选得到最终可用来做查询词扩展的词,然后通过本发明提出的打分公式为文档进行打分和排序操作。本发明的特色在于提出了一种新的查询约束词选取方式以及候选词的选取方式,并做了两次筛选操作去除无关词。还结合了传统的BM25打分公式,发明一个新的专为查询词扩展的新打分公式,能够更加科学的将查询词扩展后的结果文档进行打分,从而得出更科学的搜索排序结果。

    一种针对表格字体的识别方法

    公开(公告)号:CN110363095A

    公开(公告)日:2019-10-22

    申请号:CN201910536393.0

    申请日:2019-06-20

    Abstract: 本发明公开的一种针对表格字体的识别方法,包括以下步骤:获取表格图像,对表格图像进行预处理,包括:图像灰度化、图像去噪、图像倾斜校正;然后进行表格提取,提取表格横线、提取表格竖线、合并表格线段,去除不合格的表格线,得到完整表格;对完整表格进行定位截取,获取表格内容在完整表格中的定位;对定位截取内容进行表格内容提取,获取表格内容;使用识别技术对表格内容进行识别,得到初步识别结果,并分别训练对应的语言库,使用对应的语言库对初步识别结果进行选举,得到最终识别结果;本发明能够对多种格式的表格进行准确定位提取表格线和表格结构,能避免虚线和细线的对表格提取的干扰,能同时对印刷体和手写体进行准确识别。

Patent Agency Ranking