-
公开(公告)号:CN114973275A
公开(公告)日:2022-08-30
申请号:CN202210708633.2
申请日:2022-06-22
申请人: 信华信技术股份有限公司
IPC分类号: G06V30/19 , G06V30/162 , G06V30/146 , G06V30/164 , G06F40/284 , G06F40/289 , G06F40/30
摘要: 本发明公开了一种基于深度学习技术的图文乱码识别方法,包括以下步骤:步骤S1:获取待乱码识别的文件图像信息;步骤S1.1:将待乱码识别的文件固定在稳光环境中;步骤S1.2:通过扫描仪扫描或相机拍摄生成待处理的标签图像信息;步骤S2:将待处理的图像信息送入到OCR识别模块中进行数据预处理、文本区域检测及文字内容识别;步骤S2.1:OCR识别模块中涵盖数据预处理、文本区域检测及文字内容识别三部分功能;步骤S3:将OCR识别模块的输出结果送入到乱码判别模块中。本发明的有益效果是,通过深度学习算法训练图文检测与识别模型,结合设定阈值与语义分析技术进行生产图文乱码信息的存在性判定。