基于OCR技术的票据识别及结构恢复方法

    公开(公告)号:CN117727062A

    公开(公告)日:2024-03-19

    申请号:CN202311738558.5

    申请日:2023-12-18

    摘要: 本发明结合深度学习与计算机视觉算法,具体公开了一种基于OCR技术的票据识别及结构恢复方法,所述方法包括:s1、通过OCR技术对图片内容进行范围检测并识别文字内容;s2、对表格图片进行灰度化及二值化处理;s3、利用OpenCV中的形态学函数对二值化后的图片进行膨胀和腐蚀操作,初步得到表格的行线和列线;s4、利用霍夫变换分别检测图像中的行线和列线,同时过滤掉噪声线条;s5、计算行线和列线的交点坐标,并根据交点坐标对表格区域进行提取;s6、与s1中OCR检测与识别结果进行合并;s7、根据合并后的内容生成excel表格或其它常用存储形式。本发明利用OpenCV库中的图像处理函数,结合深度学习OCR识别技术,对表单表格进行识别和处理,进一步提高了表格OCR识别的准确率及效率。

    一种基于表单分割的实时文本检测方法

    公开(公告)号:CN117727058A

    公开(公告)日:2024-03-19

    申请号:CN202311738652.0

    申请日:2023-12-18

    摘要: 本发明结合深度学习与计算机视觉算法,具体公开了一种基于表单分割的实时文本检测方法,该方法包括如下步骤:s1、通过相机扫描获取目标表单的图像信息;s2、将通过扫描获得的表单图像上传到服务器;s3、对上传的表单图像进行预处理,并将完整表单图像进行分割;s4、使用深度学习模型,分别检测分割后表单的文本信息,完成对各个分割表单的文本信息提取;s5、使用合并算法,将各个分割表单的文本检测结果进行合并,形成完整的表单检测结果;s6、将结果实时反馈。本发明方法通过使用深度学习模型对于表单的文本信息进行提取,使用切割合并算法,充分对分割后局部表单的文本信息进行整合,实现对表单数据实时检测。

    一种复杂场景下的多目标跟踪方法

    公开(公告)号:CN118261945A

    公开(公告)日:2024-06-28

    申请号:CN202311730265.2

    申请日:2023-12-15

    IPC分类号: G06T7/277 G06T7/70

    摘要: 本发明结合深度学习与计算机视觉算法,具体公开了一种适用于复杂场景下的多目标跟踪方法。算法包含以下三个创新:引入轨迹置信度对传统卡尔曼滤波进行改进,可以在存在遮挡的场景下得到正确的匹配结果;引入了除外观与运动外的弱线索,如目标的深度信息及运动方向信息,可以有效针对遮挡及外观相似场景下不同目标间区分度较低的问题,减少误匹配率;同时还设计了一种轨迹恢复策略,可以找回因短时间内严重遮挡而丢失的目标以获得完整的轨迹。本发明实现了拥挤、遮挡或目标外观相似等复杂场景下较为鲁棒的多目标跟踪。

    一种基于深度学习的票据、表格文本实时识别方法

    公开(公告)号:CN117710998A

    公开(公告)日:2024-03-15

    申请号:CN202311739683.8

    申请日:2023-12-15

    摘要: 本发明结合深度学习与自然语言处理算法,具体公开了一种基于深度学习的票据、表格文本实时识别方法,该方法包括如下步骤:s1、对待识别的票据表格图片进行去噪等预处理;s2、对票据、表格数据进行自动标注和人工修正,得到准确的文本标签和目标文本区域;s3、对文本标签进行数据分布分析,根据分布情况进行针对性的样本扩充和数据增广;s4、以目标文本区域为输入,分解字符,采用局部和全局模块感知字符间与字符内的关系,充分挖掘特征;s5、进行测试,选择适合的规则后处理策略优化识别结果;s6、将结果实时反馈。本发明方法通过使用深度学习算法来分析票据表格文本,采用局部与全局模块充分挖掘文本细粒度特征,快速获得准确、鲁棒的识别结果。