-
公开(公告)号:CN117593758A
公开(公告)日:2024-02-23
申请号:CN202311597651.9
申请日:2023-11-28
Applicant: 重庆大学
IPC: G06V30/413 , G06V30/42 , G06V30/18 , G06V10/82 , G06N3/0464 , G06F40/30 , G06F40/289
Abstract: 本发明公开了一种识别海关单据图像中文字的方法,其包括构建用于文字识别的模型Swin‑TR,所述Swin‑TR由Swin‑T骨干、特征金字塔网络、自适应寻址和聚合模块三部分组成;训练Swin‑TR,在训练过程中分别计算字符A3模块、子词A3模块和整词A3模块的预测输出与真实标签的交叉熵,用训练合格的Swin‑TR识别单据图像中的文字。本发明识别海关单据图像中文字的方法能够准确地预测英文、中文字词以及标点符号,能够适应不同的文本识别场景,且通过实验与其它现有文本识别模型进行对比,证明了本发明方法提出的模型Swin‑TR比现有模型具有更高的文字识别准确性。