基于OCR的自定义模板图像识别方法、系统及存储介质
摘要:
本发明公开了基于OCR的自定义模板图像识别方法、系统及存储介质,对图像进行OCR识别,最终实现将识别文本转换为结构化数据,然后,基于自然语言处理技术对结构化数据信息进行错误矫正;通过自然语言技术对于所识别文字进行分词处理,从字粒度以及词粒度两方面检测错误所形成的疑似错误结果并进行错误纠正,遍历所有错误信息位置并使用形近词典替换错误位置的词,然后通过语言模型再次进行计算,得到最优纠正词进行替换。本发明通过对结构化数据的分词识别实现确定结构化数据的正确性、完整性,并对于识别错误的情况进行更正,从而实现对于结构化数据的校验,具有较好的实用性。
0/0