发明授权
- 专利标题: 识别方法、装置、设备以及存储介质
-
申请号: CN202210086983.X申请日: 2022-01-25
-
公开(公告)号: CN114495147B公开(公告)日: 2023-05-05
- 发明人: 张力文 , 丁鑫哲 , 刘凯 , 李婷婷
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京英赛嘉华知识产权代理有限责任公司
- 代理商 王达佐; 马晓亚
- 主分类号: G06V30/416
- IPC分类号: G06V30/416 ; G06V30/19
摘要:
本公开提供了一种识别方法、装置、设备以及存储介质,涉及自然语言处理、深度学习等人工智能技术领域。该方法包括:获取待识别文件,将待识别文件转换为图片格式,得到待识别图片;对待识别图片进行光学字符识别,得到识别结果,其中,识别结果包括待识别图片中的各个文本块的信息;基于识别结果确定待识别图片的页面中是否存在分栏;响应于待识别图片的页面中存在分栏,基于各个文本块的信息确定待识别图片的阅读顺序。本公开提供的识别方法根据页面版式的复杂程度,选取不同的方式进行顺序识别,提升了技术的泛化能力,从而满足了不同版式的文档解析需求。
公开/授权文献
- CN114495147A 识别方法、装置、设备以及存储介质 公开/授权日:2022-05-13