-
公开(公告)号:CN103810148A
公开(公告)日:2014-05-21
申请号:CN201210455707.2
申请日:2012-11-14
Applicant: 福建福昕软件开发股份有限公司北京分公司
Inventor: 周美玲
IPC: G06F17/22
CPC classification number: G06F17/30011
Abstract: 本发明涉及一种识别PDF文件中的空格的方法。该方法包括:步骤1:遍历PDF文件,记录各对相邻字符之间的距离;步骤2:确定各对相邻字符之间的距离中的最小值h;步骤3:用各对相邻字符之间的距离减去h,得到各对相邻字符之间的相对距离;步骤4:依次判断各对相邻字符之间的相对距离是否小于预知的空格宽度,是则该对相邻字符之间的空隙不是空格,否则,该对相邻字符之间的空隙包括空格。本发明能提高相邻字符之间是否存在空格的判断准确率。
-
公开(公告)号:CN104376317B
公开(公告)日:2018-12-14
申请号:CN201310349738.4
申请日:2013-08-12
Applicant: 福建福昕软件开发股份有限公司北京分公司
Inventor: 周美玲
IPC: G06K9/34
Abstract: 本发明涉及一种将纸质文件转换为电子文件的方法。该方法包括:步骤1:用扫描仪将纸质文件扫描为电子图片文件,所述纸质文件为记载在纸张上的文件;步骤2:按块对电子图片文件所包含的非空白部分进行切分,使非空白部分被切分为若干个块;其中,块为行和列中的一种;步骤3:将每个块切分为一个以上的字符图片;步骤4:确定块之间的位置关系以及属于同一块的字符图片之间的位置关系;步骤5:将属于同一块的所有字符图片按照相互之间的位置关系排列为一个新块;步骤6:将所有新块按照块之间的位置关系排列,得到电子文件。本发明能同时提高转换效率以及电子文件与纸质文件内容的相符程度。
-
公开(公告)号:CN104376317A
公开(公告)日:2015-02-25
申请号:CN201310349738.4
申请日:2013-08-12
Applicant: 福建福昕软件开发股份有限公司北京分公司
Inventor: 周美玲
IPC: G06K9/34
CPC classification number: G06K9/00463 , G06F17/211 , G06K9/00456 , G06K9/34 , G06K2209/01 , G06K9/00442 , G06K9/348
Abstract: 本发明涉及一种将纸质文件转换为电子文件的方法。该方法包括:步骤1:将纸质文件扫描为电子图片文件;步骤2:按块对电子图片文件所包含的非空白部分进行切分,使非空白部分被切分为若干个块;其中,块为行和列中的一种;步骤3:将每个块切分为一个以上的字符图片;步骤4:确定块之间的位置关系以及属于同一块的字符图片之间的位置关系;步骤5:将属于同一块的所有字符图片按照相互之间的位置关系排列为一个新块;步骤6:将所有新块按照块之间的位置关系排列,得到电子文件。本发明能同时提高转换效率以及电子文件与纸质文件内容的相符程度。
-
-