一种图片型医疗检查报告文字提取方法

    公开(公告)号:CN117238432A

    公开(公告)日:2023-12-15

    申请号:CN202311327788.2

    申请日:2023-10-13

    摘要: 本发明涉及一种图片型医疗检查报告文字提取方法。包括对图片型医疗检查报告数据集进行数据标注,训练符合需求的图片型医疗检查报告文字提取的版面分析模型,对输入报告图片进行版面分析,对版面分析返回结果调用文本检测和文本识别,将调用文本检测和文本识别返回结果进行版面调整,并将调整后的结果输出到文本文件。与现有技术相比,本发明的有益效果是:保护患者隐私;将图片报告数字化,方便存储和展示。本文搜集报告图片,进行数据标注,对标注结果进行训练,得到能对图片型医疗检测报告进行正确版面分析的模型,使用文本检查、文本识别对版面分析结果进行处理,将前述步骤得到的数字化结果转化为文本文件。