摘要:
本申请实施例提供一种文档识别方法及装置,包括:获取文档图像;将文档图像输入预先构建的文档识别模型,由所述文档识别模型输出文档识别结果;其中,所述文档识别模型包括多层编码器、至少两个下采样层、特征金字塔和多层解码器,所述特征金字塔的特征图像包括其中一层编码器输出的第一尺度的特征图像、经过一个下采样层和多层编码器处理输出的第二尺度的特征图像和经过另一个下采样层和多层编码器处理输出的第三尺度的特征图像,所述特征金字塔用于对各特征图像融合处理后生成特征隐向量,多层解码器用于对所述特征隐向量处理后输出词元序列。本申请能够提高从文档图像识别文档内容的准确性。
0/0