一种基于图像识别的文字提取方法

    公开(公告)号:CN119672722A

    公开(公告)日:2025-03-21

    申请号:CN202411445926.1

    申请日:2024-10-16

    Abstract: 本发明提出了一种基于图像识别的文字提取方法,利用图像采集装置获取文本图像,使用高斯低通滤波算法降噪处理,拉普拉斯算子增强图像的边缘和细节,人工检查并进行旋转调整;文本检测和内容识别分开针对训练,集成识别;强化YOLOv8回归检测头提高预测文本框的精度以及减少模型预测过程中非极大抑制操作提升效率,文本内容识别采用基于Transformer的特征融合扩展模型,通过自身特征扩展和交叉融合扩展方式提升文本识别精度,内容识别模型的训练数据集来自本文区域检测保存的结果;通过CTC损失引入“空”字符的方式对内容识别模型进行训练。本发明可以有效识别文本图像,提高了模型检测速度和精度。

    结合关键点检测和目标检测的人体行为检测方法及装置

    公开(公告)号:CN118506455A

    公开(公告)日:2024-08-16

    申请号:CN202410743173.6

    申请日:2024-06-07

    Abstract: 本发明公开了一种结合关键点检测和目标检测的人体行为检测方法,所诉方法包括:采集并保存站立,坐立,运动,卧躺多种人体姿态数据以及烟头,手机的物品数据;根据采集到的数据进行人工标注,数据预处理,并制作成数据集,按照一定比例分成训练集和测试集;构建人体行为检测模型,构建的思想使用双通道交互模块对关键的空间信息进行表征,并同时优化视觉特征,构建了一个多分支的深度神经网络,将各个分支的结果进行合并。首先利用人体检测器检测到人体框,利用人体姿态估计获取面部和手腕部关键点区域,将人体面部和手腕部的特征作为一种感知学习模块充分获取不同层级的上下文语义信息,结合烟头和手机的位置信息判别人体是否处于抽烟,玩手机,打电话的状态,其次利用人体肩关节,腰关节,膝关节和踝关节的相关特征信息提取位置信息以及位置之间的相关性判别人体是否摔倒。本发明通过关键点检测和目标检测交互的方法来确定人体所处的状态,鲁棒性更强,灵活性更强,识别率更高。

    一种输电线路异物检测方法
    9.
    发明公开

    公开(公告)号:CN118429777A

    公开(公告)日:2024-08-02

    申请号:CN202410664340.8

    申请日:2024-05-27

    Abstract: 本发明公开一种输电线路异物检测方法,通过改进的LSKNet技术,提升主模型YOLOv8网络在复杂环境下对遮挡异物的检测能力;其次,将骨干网络的部分C2F换成本发明设计的一种并行的大卷积核结构ECLK block,通过EC block和LK block并行操作,能够有效获得更广阔空间范围的目标特征,减少特征图冗余的背景信息;在检测头部分,采用了允许卷积核具有任意数量的参数和采样形状的可变核卷积(AKConv)替换传统卷积模块,提高特征提取的准确性;提出一种新的IoU损失函数计算方法DhIoU。与现有技术相比,改进后的YOLOv8模型在输电线路异物检测方面,克服了现有技术中鲁棒性差、背景纹理遮挡导致准确率低的问题,具有结构简单、参数量更少,收敛速度更快的优点。

Patent Agency Ranking