识别方法、装置、设备以及存储介质
摘要:
本公开提供了一种识别方法、装置、设备以及存储介质,涉及自然语言处理、深度学习等人工智能技术领域。该方法包括:获取待识别文件,将待识别文件转换为图片格式,得到待识别图片;对待识别图片进行光学字符识别,得到识别结果,其中,识别结果包括待识别图片中的各个文本块的信息;基于识别结果确定待识别图片的页面中是否存在分栏;响应于待识别图片的页面中存在分栏,基于各个文本块的信息确定待识别图片的阅读顺序。本公开提供的识别方法根据页面版式的复杂程度,选取不同的方式进行顺序识别,提升了技术的泛化能力,从而满足了不同版式的文档解析需求。
公开/授权文献
0/0