一种文本图片矫正方法及装置
    6.
    发明公开

    公开(公告)号:CN112016341A

    公开(公告)日:2020-12-01

    申请号:CN201910449861.0

    申请日:2019-05-28

    IPC分类号: G06K9/00 G06K9/32

    摘要: 本发明实施例提供了一种文本图片矫正方法及装置,通过获取待矫正的文本图片,对文本图片进行文本行检测,得到各文本行在文本图片中的位置信息,根据各文本行的位置信息,计算各文本行对应于指定方向的偏转角度,根据各文本行对应于指定方向的偏转角度,基于预设数据统计策略,计算文本图片的矫正角度,基于矫正角度,旋转文本图片,得到矫正后的文本图片。整个文本图片的矫正角度是基于所有文本行的偏转角度计算得到的,矫正角度能够更为准确的反应各文本行的偏转,因此,在基于矫正角度对文本图片进行旋转时,能够保证尽可能多的文本行旋转至便于用户查看的方向,提高了矫正角度的准确性,矫正后的文本图片具有更为理想的矫正效果。

    文档处理方法及装置
    7.
    发明公开

    公开(公告)号:CN117668336A

    公开(公告)日:2024-03-08

    申请号:CN202211042633.X

    申请日:2022-08-29

    摘要: 本发明提供一种文档处理方法及装置,其中,该方法包括:拍摄目标文档,获取第一图片;基于第一图片,生成目标格式的第一文件,并基于第一图片,对第一文件进行分类,确定第一文件的第一类型;提取第一图片中的文字信息,并基于文字信息,确定第一文件的第二类型;第二类型是第一类型的子类型。本发明提供的文档处理方法及装置,通过拍摄目标文档,获取第一图片,基于第一图片进行粗分类,自动确定第一文件的第一类型,然后基于第一图片中的文字信息进行细分类,自动确定第一文件的第二类型,能更快速、高效地确定第一文件的第一类型和第二类型,能基于第一文件的第一类型和第二类型,对第一文件进行更高效的归类,能提高纸质文档归类的效率。

    一种实现字符识别的方法、装置、计算机存储介质及终端

    公开(公告)号:CN115393883A

    公开(公告)日:2022-11-25

    申请号:CN202110571960.3

    申请日:2021-05-25

    发明人: 段纪伟 熊龙飞

    摘要: 一种实现字符识别的方法、装置、计算机存储介质及终端,本发明实施例基于PDF文档获取包含预设数量个字符的字符图像,并对字符图像进行多字识别;多字识别的结果包含预设数量个字符的情况下,根据多字识别的结果确定PDF文档中包含的字符的最终识别结果。本发明实施例对PDF文件中的字符进行读取和渲染,可以确定字符图像在PDF中的具体对应哪个字符,在多字识别的结果包含预设数量个字符的情况下,实现了漏检或多检的快速确认,并根据多字识别的结果提升了字符识别的准确率;在之后将识别的结果转换的统一码(Unicode)附加到PDF的相应字符上,实现了PDF文档中包含的字符的准确识别。