一种基于图像识别的文字提取方法

    公开(公告)号:CN119672722A

    公开(公告)日:2025-03-21

    申请号:CN202411445926.1

    申请日:2024-10-16

    Abstract: 本发明提出了一种基于图像识别的文字提取方法,利用图像采集装置获取文本图像,使用高斯低通滤波算法降噪处理,拉普拉斯算子增强图像的边缘和细节,人工检查并进行旋转调整;文本检测和内容识别分开针对训练,集成识别;强化YOLOv8回归检测头提高预测文本框的精度以及减少模型预测过程中非极大抑制操作提升效率,文本内容识别采用基于Transformer的特征融合扩展模型,通过自身特征扩展和交叉融合扩展方式提升文本识别精度,内容识别模型的训练数据集来自本文区域检测保存的结果;通过CTC损失引入“空”字符的方式对内容识别模型进行训练。本发明可以有效识别文本图像,提高了模型检测速度和精度。

    一种基于DCG及双分支并行的地铁客流量预测方法及装置

    公开(公告)号:CN118469079B

    公开(公告)日:2025-01-21

    申请号:CN202410607726.5

    申请日:2024-05-16

    Abstract: 本发明公开了一种基于DCG及双分支并行的地铁客流量预测方法及装置,所述方法包括:首先,构建地铁通行网络,其中节点表示站台点,节点所连边表示站台间的到达关系;其次,通过地铁通行网络和实体测量数据构建包括深度关系矩阵、旅行距离权重矩阵和乘客流量权重矩阵融合的DCG模块;最后,将DCG模块编码送入SBULSTM模块与Transformer模块双分支并行的预测神经网络。本发明通过DCG模块,还原地铁网络的实际拓扑结构,捕捉由站点到站线的客流特征;同时,并行SBULSTM模块与Transformer模块既能考虑时间序列的前后向状态,又能够学习复杂的时间特征、捕捉DCG所提供全局空间上的客流信息,加强全局时空通道的交互以减少信息的损失,提高了综合时空预测的能力。

    一种基于改进的人脸等密度线分析匹配统计模型算法的人脸识别方法

    公开(公告)号:CN114581997B

    公开(公告)日:2024-12-13

    申请号:CN202210242410.1

    申请日:2022-03-11

    Abstract: 本发明涉及图像识别技术领域,公开了一种基于改进的人脸等密度线分析匹配统计模型算法的人脸识别方法,包括:获取图像,对图像进行预处理后分为测试集和训练集,对训练集利用改进的等密度线分析匹配统计模型算法,使用非重叠的采样窗口扫描图像,得到了训练后的人脸等密度分析匹配模型;利用测试集对人脸等密度分析匹配模型进行测试并输出人脸等密度模型匹配分类图像识别结果;最终利用人脸等密度分析匹配识别模型FRM进行人脸识别。与现有技术相比,本发明减少了人脸训练与识别的计算量,提高了识别的稳定性,不需要对每个人脸模型都计算相似度,并且几乎不降低识别率的前提下,提高识别的速度。

    一种基于EIEM边缘特征提取的钢铁缺陷检测方法

    公开(公告)号:CN118823473A

    公开(公告)日:2024-10-22

    申请号:CN202410959754.3

    申请日:2024-07-17

    Abstract: 本发明公开一种基于EIEM边缘特征提取的钢铁缺陷检测方法,首先设计一个边缘信息提取模块EIEM替换C2f中的BottleNeck,该模块采用sobel算子来提取特征的边缘信息并与整体空间信息进行特征融合,获得更加丰富的语义信息;其次,替换上采样方法为CARAFE,该方法通过编码器能够学习到适合自己特征信息的卷积核,以指导更加精确的特征重建;最后,将原来的检测头换成了动态统一的检测头(DyHead),以应对不同缺陷的尺寸和变换位置,而且正因为这个检测头,在不同的尺寸、位置、任务中,都能动态的适应,不需要改变检测头。与现有技术相比,本发明克服了现有技术中鲁棒性差、引入噪声导致缺陷检测准确率低的问题,利用改进YOLOv8s模型架构,具有准确性高,适用广度大的优点。

    一种基于动态图网络的水质预测方法

    公开(公告)号:CN118228160A

    公开(公告)日:2024-06-21

    申请号:CN202410432828.8

    申请日:2024-04-11

    Abstract: 本发明公开了一种基于动态图网络的水质预测方法。包括:获取历史水质数据以及跨领域多源异构数据;建立总模型,包括输入层、DGTCN模型、输出层,所述DGTCN模型包括GCN模块、TCN模块;其中,输入层将历史水质数据以及跨领域多源异构数据转化为动态图网络;GCN模块基于图卷积提取并更新动态图网络的图结构特征,TCN模块基于因果卷积和扩张卷积优化图结构特征后输入至输出层;输出层输出水质预测结果。本发明综合考虑了与水质相关的多种因素以及变量,从时间角度对水质采用动态图网络的形式进行分析预测,具有精确度高、实用性强的特点。

    一种基于知识蒸馏的双重先验文本分类方法

    公开(公告)号:CN118227795A

    公开(公告)日:2024-06-21

    申请号:CN202410437957.6

    申请日:2024-04-11

    Abstract: 本发明涉及一种基于知识蒸馏的双重先验文本分类方法,首先文本样本进行清洗和预处理,制作领域字典。通过人工获取可信度较高先验知识,再通过对比学习扩充人工标注,得出Ar标签损失;另一方面,使用了LGTMX—R模块,利用知识蒸馏进行损失计算Loss,再用其反馈到学生模型中,提高其在验证集上泛化性;接着两个不同的标签损失的基础上,使用动态加权,使得标签损失经过多轮计算过后更具鲁棒性,得到最优损失;最后在输出层对语义信息进行分类。本发明知识蒸馏可以更好地减少模型参数,加快模型速率,因此模型分类的性能更加健壮,并且双重先验文本分类模型中的特征提取得到更好地加强,能够有效提高模型性能。

    一种基于GS_YOLOv7的火灾检测方法
    9.
    发明公开

    公开(公告)号:CN117292216A

    公开(公告)日:2023-12-26

    申请号:CN202310400563.9

    申请日:2023-04-14

    Abstract: 本发明公开了一种基于GS_YOLOv7的火灾检测方法,包括改进了模型Backbone与Head部分,引入了Shuffle Attention Module;引入了GSConv模块;在Head层中引入VoVGSCSP module;在训练策略方面,将YOLOv7网络模型CBS模块改进为效率更高的CBF模块;将模型损失函数改为EIoU loss,一张640*640的特征图输入到网络的Backbone层,经过CBF,E‑ELAN以及MP模块后输出三张不同的特征图,将20*20*1024大小的特征图输入到Head层经过VoVGSCSP module中可提高网络的推理速度,特征图经过GSConv模块,模型可以提取更加丰富的语义信息,在特征提取后的非线性激活阶段,Funnel激活函数增强了模型的空间感知能力,引入了EIoU loss使得模型的收敛速度更快。本发明通过优化模型结构,引入新的激活函数和损失函数,提高了模型的效率和泛用性。

Patent Agency Ranking