发明公开
- 专利标题: 基于OCR和LLM的费用明细清单识别方法及系统
-
申请号: CN202410853316.9申请日: 2024-06-28
-
公开(公告)号: CN118747899A公开(公告)日: 2024-10-08
- 发明人: 王步宜 , 苗伟 , 常博 , 孙召敏 , 马杰 , 邢鑫 , 朱洁 , 沈义晖
- 申请人: 南京市智慧医疗投资运营服务有限公司
- 申请人地址: 江苏省南京市栖霞区紫东国际创意园B4-1栋601室
- 专利权人: 南京市智慧医疗投资运营服务有限公司
- 当前专利权人: 南京市智慧医疗投资运营服务有限公司
- 当前专利权人地址: 江苏省南京市栖霞区紫东国际创意园B4-1栋601室
- 代理机构: 南京理工信达知识产权代理有限公司
- 代理商 彭甲临
- 主分类号: G06V30/30
- IPC分类号: G06V30/30 ; G06V30/146 ; G06V10/82
摘要:
本发明涉及一种基于OCR和LLM的费用明细清单识别方法和系统,包括采集待处理图像,检测待处理图像的费用明细区域并截取第一子图;采用OCR识别第一子图获取第一集合,基于第一集合构建仿射变换矩阵进行图片水平校正,并获取水平校正后的第二子图;采用OCR识别第二子图获取第二集合,基于第二集合对第二子图中的文本行进行行列校正,校正后的文本行信息构成第三集合;基于第三集合构建prompt,并结合大型语言模型获取费用明细识别信息。本发明通过多阶段的图像处理和OCR文字识别优化,显著提升复杂条件下文本识别精度;引入大语言模型,赋能空间位置关系理解能力,实现了从文本数据到特定信息提取的智能化飞跃,减少了人工干预,提高了效率。