-
公开(公告)号:CN118747899A
公开(公告)日:2024-10-08
申请号:CN202410853316.9
申请日:2024-06-28
申请人: 南京市智慧医疗投资运营服务有限公司
IPC分类号: G06V30/30 , G06V30/146 , G06V10/82
摘要: 本发明涉及一种基于OCR和LLM的费用明细清单识别方法和系统,包括采集待处理图像,检测待处理图像的费用明细区域并截取第一子图;采用OCR识别第一子图获取第一集合,基于第一集合构建仿射变换矩阵进行图片水平校正,并获取水平校正后的第二子图;采用OCR识别第二子图获取第二集合,基于第二集合对第二子图中的文本行进行行列校正,校正后的文本行信息构成第三集合;基于第三集合构建prompt,并结合大型语言模型获取费用明细识别信息。本发明通过多阶段的图像处理和OCR文字识别优化,显著提升复杂条件下文本识别精度;引入大语言模型,赋能空间位置关系理解能力,实现了从文本数据到特定信息提取的智能化飞跃,减少了人工干预,提高了效率。
-
公开(公告)号:CN118736602A
公开(公告)日:2024-10-01
申请号:CN202410819045.5
申请日:2024-06-24
申请人: 南京市智慧医疗投资运营服务有限公司
IPC分类号: G06V30/19 , G06V30/18 , G06V30/42 , G06V10/52 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明涉及一种基于全局文本识别的图像模糊度检测方法及系统,包括采集票据图片,检测票据图片的票据区域并截取子图;对子图进行文本检测获取子图的文本行集合;对文本行集合进行文本识别,获取每个文本字符的置信度,将各文本行文本字符置信度的均值作为各文本行的模糊度,获取文本行模糊度集合;计算文本行模糊度集合的均值与方差,将均值和方差与预设值进行比较,判定票据图片模糊度。本发明不仅对整个图片进行模糊度判断,还针对每一个文本字符进行模糊度判断;这种精细化的处理方式可以更加准确地确定票据图片的清晰度,并识别出哪些字符可能由于模糊而不可用。
-