-
公开(公告)号:CN111461062B
公开(公告)日:2023-12-19
申请号:CN202010326925.0
申请日:2020-04-23
Applicant: 国网吉林省电力有限公司 , 国网吉林省电力有限公司电力科学研究院
IPC: G06V30/41 , G06F40/126
Abstract: 本发明提供一种票据图像文本信息的结构化抽取方法,利用顺次邻近算子可以依据文本在图像上的间隔规律来形成文本字符串,并基于不同字符串的交叠和长度情况对冗余内容进行删除,实现文本信息的结构化抽取。能够自动的基于票据上文本字符邻近、排列规律情况的结构化规律,并基于结构输出文本内容,防止票据上不同文本的排列结构对票据文本内容抽取造成的干扰,提高票据图像文本信息抽取质量。
-
公开(公告)号:CN111461062A
公开(公告)日:2020-07-28
申请号:CN202010326925.0
申请日:2020-04-23
Applicant: 国网吉林省电力有限公司 , 国网吉林省电力有限公司电力科学研究院
IPC: G06K9/00 , G06F40/126
Abstract: 本发明提供一种票据图像文本信息的结构化抽取方法,利用顺次邻近算子可以依据文本在图像上的间隔规律来形成文本字符串,并基于不同字符串的交叠和长度情况对冗余内容进行删除,实现文本信息的结构化抽取。能够自动的基于票据上文本字符邻近、排列规律情况的结构化规律,并基于结构输出文本内容,防止票据上不同文本的排列结构对票据文本内容抽取造成的干扰,提高票据图像文本信息抽取质量。
-