-
公开(公告)号:CN113673501B
公开(公告)日:2023-01-13
申请号:CN202110970634.X
申请日:2021-08-23
IPC分类号: G06V10/22 , G06V10/26 , G06V30/148 , G06V10/774 , G06V10/764 , G06V10/762 , G06F16/951
摘要: 本申请公开了一种OCR分类方法、系统、电子设备及存储介质,本方法通过网络爬虫技术获取图像样本集,以提高数据来源多样性,提取图像样本集中每个图像样本的字符特征,并根据字符特征生成标签数据对相应的图像样本进行标注,以得到图像和字符特征之间的映射关系,再对标注图像样本集进行增广技术处理,以提高图像样本多样性,并将增广后得到的图像增广样本集按照一定比例划分为训练样本集和测试样本集,利用训练样本集对预设的OCR分类模型进行数据训练,以得到初始的OCR分类模型,并利用测试样本集对初始的OCR分类模型进行准确度测试,从而得到准确度高于预设准确度阈值的OCR分类模型,进而提高了图文信息分类的效率和准确度。