基于OCR和LLM的费用明细清单识别方法及系统

    公开(公告)号:CN118747899A

    公开(公告)日:2024-10-08

    申请号:CN202410853316.9

    申请日:2024-06-28

    摘要: 本发明涉及一种基于OCR和LLM的费用明细清单识别方法和系统,包括采集待处理图像,检测待处理图像的费用明细区域并截取第一子图;采用OCR识别第一子图获取第一集合,基于第一集合构建仿射变换矩阵进行图片水平校正,并获取水平校正后的第二子图;采用OCR识别第二子图获取第二集合,基于第二集合对第二子图中的文本行进行行列校正,校正后的文本行信息构成第三集合;基于第三集合构建prompt,并结合大型语言模型获取费用明细识别信息。本发明通过多阶段的图像处理和OCR文字识别优化,显著提升复杂条件下文本识别精度;引入大语言模型,赋能空间位置关系理解能力,实现了从文本数据到特定信息提取的智能化飞跃,减少了人工干预,提高了效率。