基于编解码结构的发票文本识别方法及装置
Abstract:
本发明公开了基于编解码结构的发票文本识别方法及装置,涉及票据文本识别技术领域;方法包括S2文本图片特征提取,处理器将预处理图片处理为统一尺寸的制式图片,第一卷积神经网络对制式图片进行特征提取并获得三维特征向量矩阵F;S3卷积神经网络特征编码,第二卷积神经网络将三维特征向量矩阵F转换为可供门控循环神经网络序列解码输入的待解码特征向量G;S4门控循环神经网络序列解码,门控循环神经网络将待解码特征向量G解码并获得发票文本图片中对应的文字;装置包括文本图片特征提取模块、卷积神经网络特征编码模块和门控循环神经网络序列解码模块;其通过步骤S2至步骤S4等,实现了识别发票图片中的长文本。
Public/Granted literature
Patent Agency Ranking
0/0