- 专利标题: 一种医疗票据图像结构化方法和装置、计算机可读介质
-
申请号: CN202110193283.6申请日: 2021-02-20
-
公开(公告)号: CN112926577B公开(公告)日: 2021-11-26
- 发明人: 康帅兵 , 褚一平 , 陈建勇 , 郑义 , 朱华山 , 郁星星 , 张雪妮 , 陈士春 , 潘翔 , 赵小敏 , 郑河荣
- 申请人: 杭州海量信息技术有限公司
- 申请人地址: 浙江省杭州市西湖区文一西路75号3号楼五层502室
- 专利权人: 杭州海量信息技术有限公司
- 当前专利权人: 杭州海量信息技术有限公司
- 当前专利权人地址: 浙江省杭州市西湖区文一西路75号3号楼五层502室
- 代理机构: 北京盛询知识产权代理有限公司
- 代理商 方亚兵
- 主分类号: G06K9/32
- IPC分类号: G06K9/32 ; G06K9/34 ; G06K9/36 ; G06K9/62
摘要:
本发明公开一种基于均值聚类和字符识别的医疗票据图像结构化方法和装置、计算机可读介质,包括:步骤1、对获取的医疗票据图像进行OCR字符识别,得到票据全文字符串信息;步骤S2、对所述票据全文字符串信息进行KMeans聚类;步骤S3、根据聚类结果确定标题位置,根据所述标题位置信息,提取对应列所在的条目数据;步骤S4、对所述条目数据进行合法性校验和修正,得到所述医疗票据的结构化数据。采用本发明的技术方案,可以大幅度提高票据结构化效果。
公开/授权文献
- CN112926577A 一种医疗票据图像结构化方法和装置、计算机可读介质 公开/授权日:2021-06-08