-
公开(公告)号:CN118711191A
公开(公告)日:2024-09-27
申请号:CN202410510028.3
申请日:2024-04-26
申请人: 厦门理工学院 , 福建火炬电子科技股份有限公司
IPC分类号: G06V30/16 , G06V30/14 , G06V30/148 , G06V30/18 , G06V30/19 , G06V30/41 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048
摘要: 本发明提出一种应用于扭曲文档的文档图像校正方法及其装置,包括:构建并训练获得基于几何失真和照明表征的文档图像校正模型;将待检测的文档图像信息输入获得的所述校正模型中,得到几何校正后的文档图像,再根据所述文档图像所受的环境光信息区分是否需要进行亮度表征学习;对于所受的环境光信息很差的文档图像,将经过几何表示学习后把图像输入到亮度表征模型中,得到亮度表征学习后的文档图像;对于照明条件良好的图像,则不需要进行亮度表征学习;将输出的文档图像结果,输出至下游任务进行文字识别或者关键信息提取处理。实现对歪曲的和环境光差的文档图像分别进行几何表示和亮度表征学习;同时引入多层注意力机制提高文档图像校正的精度。
-
公开(公告)号:CN118918589A
公开(公告)日:2024-11-08
申请号:CN202411399134.5
申请日:2024-10-09
申请人: 厦门理工学院
IPC分类号: G06V30/146 , G06V30/19 , G06V30/18 , G06V10/82 , G06N3/0464
摘要: 本发明涉及一种基于网格点的医疗文档图像矫正识别方法及系统,该方法包括以下步骤:步骤A:获取医疗文档的待矫正图像及其对应的真实图像,构建测试数据集;步骤B:构建基于网格点的医疗文档图像矫正模型并通过训练数据集对其进行训练,得到训练好的医疗文档图像矫正模型;步骤C:利用测试数据集对训练好的医疗文档图像矫正模型进行测试,评估合格的即为最终得到的医疗文档图像矫正模型;步骤D:将最终得到的医疗文档图像矫正模型应用于医疗文档图像矫正,获取矫正后的医疗文档图像;然后对矫正后的医疗文档图像进行文字识别,得到识别后的医疗文本。该方法及系统有利于快速、准确地校正医疗文档图像并对其进行文字识别。
-
公开(公告)号:CN118898846A
公开(公告)日:2024-11-05
申请号:CN202411396493.5
申请日:2024-10-09
申请人: 厦门理工学院
IPC分类号: G06V30/146 , G06V30/148 , G06V30/18 , G06V10/82 , G06N3/0455 , G06N3/0464
摘要: 本发明提出一种应用于歪曲试卷的文档矫正系统,包括试卷图像的分割模块和基于多头注意力机制的试卷图像矫正模块;所述试卷图像的分割模块基于UNet构建的分割模型以实现对于试卷文档的左缘信息和右缘信息分割,通过卷积层、残差连接以及转置卷积层提取和融合图像特征,以获得图像分割图,随后进行后处理以获得实际的掩码图;再将分割后的信息输入到基于多头注意力机制的试卷图像矫正模块中以对分割后的图形进行矫正;所述基于多头注意力机制的试卷图像矫正模块采用Transformer结构,包括Encoder‑Decoder结构,采用多头注意力结构网络生成图像的光流图,通过一系列的Encoder编码器块进行逐步降采样和Decoder解码器块进行逐步上采样,得到矫正后的试卷文档图像。
-
-