-
公开(公告)号:CN117238432A
公开(公告)日:2023-12-15
申请号:CN202311327788.2
申请日:2023-10-13
申请人: 郑州大学第一附属医院
IPC分类号: G16H15/00 , G16H50/70 , G06F40/106 , G06F40/279 , G06F18/214
摘要: 本发明涉及一种图片型医疗检查报告文字提取方法。包括对图片型医疗检查报告数据集进行数据标注,训练符合需求的图片型医疗检查报告文字提取的版面分析模型,对输入报告图片进行版面分析,对版面分析返回结果调用文本检测和文本识别,将调用文本检测和文本识别返回结果进行版面调整,并将调整后的结果输出到文本文件。与现有技术相比,本发明的有益效果是:保护患者隐私;将图片报告数字化,方便存储和展示。本文搜集报告图片,进行数据标注,对标注结果进行训练,得到能对图片型医疗检测报告进行正确版面分析的模型,使用文本检查、文本识别对版面分析结果进行处理,将前述步骤得到的数字化结果转化为文本文件。