一种基于网格点的医疗文档图像矫正识别方法及系统

    公开(公告)号:CN118918589A

    公开(公告)日:2024-11-08

    申请号:CN202411399134.5

    申请日:2024-10-09

    摘要: 本发明涉及一种基于网格点的医疗文档图像矫正识别方法及系统,该方法包括以下步骤:步骤A:获取医疗文档的待矫正图像及其对应的真实图像,构建测试数据集;步骤B:构建基于网格点的医疗文档图像矫正模型并通过训练数据集对其进行训练,得到训练好的医疗文档图像矫正模型;步骤C:利用测试数据集对训练好的医疗文档图像矫正模型进行测试,评估合格的即为最终得到的医疗文档图像矫正模型;步骤D:将最终得到的医疗文档图像矫正模型应用于医疗文档图像矫正,获取矫正后的医疗文档图像;然后对矫正后的医疗文档图像进行文字识别,得到识别后的医疗文本。该方法及系统有利于快速、准确地校正医疗文档图像并对其进行文字识别。

    一种应用于歪曲试卷的文档矫正系统

    公开(公告)号:CN118898846A

    公开(公告)日:2024-11-05

    申请号:CN202411396493.5

    申请日:2024-10-09

    摘要: 本发明提出一种应用于歪曲试卷的文档矫正系统,包括试卷图像的分割模块和基于多头注意力机制的试卷图像矫正模块;所述试卷图像的分割模块基于UNet构建的分割模型以实现对于试卷文档的左缘信息和右缘信息分割,通过卷积层、残差连接以及转置卷积层提取和融合图像特征,以获得图像分割图,随后进行后处理以获得实际的掩码图;再将分割后的信息输入到基于多头注意力机制的试卷图像矫正模块中以对分割后的图形进行矫正;所述基于多头注意力机制的试卷图像矫正模块采用Transformer结构,包括Encoder‑Decoder结构,采用多头注意力结构网络生成图像的光流图,通过一系列的Encoder编码器块进行逐步降采样和Decoder解码器块进行逐步上采样,得到矫正后的试卷文档图像。