-
公开(公告)号:CN108959203A
公开(公告)日:2018-12-07
申请号:CN201810549598.8
申请日:2013-12-18
申请人: 国网江苏省电力有限公司常州供电分公司 , 国网江苏省电力有限公司 , 国家电网公司
摘要: 本发明涉及一种文挡录入并比对的方法,首先判断待录入文档是否为纸质文档,如果是纸质文档则通过前端设备将纸制文件自动扫描录入原始格式文档库中,如果是电子文档则直接录入原始格式文档库中,再将原始格式文档库中的所有文档转换为统一格式的文档,然后对文档进行关键属性标注和基础管理,最后通过Nakastu算法和分词系统进行基于内容的文档比对,并将根据比对相似程度进行文档关联且录入数据库中。本发明能将各类型和格式的文档自动录入、统一分类、智能管理和与已有文件的比对,提高文档利用效率,节省文档比对时间,提升文档管理效率。
-
公开(公告)号:CN108984593A
公开(公告)日:2018-12-11
申请号:CN201810549599.2
申请日:2013-12-18
申请人: 国网江苏省电力有限公司常州供电分公司 , 国网江苏省电力有限公司 , 国家电网公司
摘要: 本发明涉及一种多格式文挡录入并比对的方法,首先判断待录入文档是否为纸质文档,如果是纸质文档则通过前端设备将纸制文件自动扫描录入原始格式文档库中,如果是电子文档则直接录入原始格式文档库中,再将原始格式文档库中的所有文档转换为统一格式的文档,然后对文档进行关键属性标注和基础管理,最后通过Nakastu算法和分词系统进行基于内容的文档比对,并将根据比对相似程度进行文档关联且录入数据库中。本发明能将各类型和格式的文档自动录入、统一分类、智能管理和与已有文件的比对,提高文档利用效率,节省文档比对时间,提升文档管理效率。
-
公开(公告)号:CN108804624A
公开(公告)日:2018-11-13
申请号:CN201810549597.3
申请日:2013-12-18
申请人: 国网江苏省电力有限公司常州供电分公司 , 国网江苏省电力有限公司 , 国家电网公司
IPC分类号: G06F17/30
摘要: 本发明涉及一种文挡录入并比对的方法,首先判断待录入文档是否为纸质文档,如果是纸质文档则通过前端设备将纸制文件自动扫描录入原始格式文档库中,如果是电子文档则直接录入原始格式文档库中,再将原始格式文档库中的所有文档转换为统一格式的文档,然后对文档进行关键属性标注和基础管理,最后通过Nakastu算法和分词系统进行基于内容的文档比对,并将根据比对相似程度进行文档关联且录入数据库中。本发明能将各类型和格式的文档自动录入、统一分类、智能管理和与已有文件的比对,提高文档利用效率,节省文档比对时间,提升文档管理效率。
-
公开(公告)号:CN103823838B
公开(公告)日:2018-07-20
申请号:CN201310696955.0
申请日:2013-12-18
申请人: 国网江苏省电力有限公司常州供电分公司 , 国网江苏省电力有限公司 , 国家电网公司
IPC分类号: G06F17/30
摘要: 本发明涉及一种多格式文档录入并比对的方法,首先判断待录入文档是否为纸质文档,如果是纸质文档则通过前端设备将纸制文件自动扫描录入原始格式文档库中,如果是电子文档则直接录入原始格式文档库中,再将原始格式文档库中的所有文档转换为统一格式的文档,然后对文档进行关键属性标注和基础管理,最后通过Nakastu算法和分词系统进行基于内容的文档比对,并将根据比对相似程度进行文档关联且录入数据库中。本发明能将各类型和格式的文档自动录入、统一分类、智能管理和与已有文件的比对,提高文档利用效率,节省文档比对时间,提升文档管理效率。
-
公开(公告)号:CN112100630A
公开(公告)日:2020-12-18
申请号:CN201910528848.4
申请日:2019-06-18
申请人: 国网江苏省电力有限公司常州供电分公司 , 国网江苏省电力有限公司 , 国家电网有限公司
摘要: 本发明涉及一种针对保密文件的识别方法,包括如下几个步骤:第一步、预处理;第二步、文本检测;第三步、光学字符识别;第四步、从照片中提取关键字,查看是否为涉密文件;第五步、通过保密文件的OCR模板查看是否为涉密文件;第六步、EXIF信息附助;第七步、设置可疑系数,上传至后台管理员;第八步、文档部分查询;第九步、提高扫描效率。本发明针对保密文件的检测,不仅利用现有的OCR技术,而且针对保密文件的特性,生成了多套模板,提高了保密文件的识别率,以及解析速度。
-
公开(公告)号:CN112115735A
公开(公告)日:2020-12-22
申请号:CN201910528541.4
申请日:2019-06-19
申请人: 国网江苏省电力有限公司常州供电分公司 , 国网江苏省电力有限公司 , 国家电网有限公司
摘要: 本发明涉及一种针对保密文件的识别管理方法,包括如下几个步骤:第一步、预处理;第二步、文本检测;第三步、光学字符识别;第四步、从照片中提取关键字,查看是否为涉密文件;第五步、通过保密文件的OCR模板查看是否为涉密文件;第六步、EXIF信息附助;第七步、设置可疑系数,上传至后台管理员;第八步、文档部分查询;第九步、提高扫描效率。本发明针对保密文件的检测,不仅利用现有的OCR技术,而且针对保密文件的特性,生成了多套模板,提高了保密文件的识别率,以及解析速度。
-
-
-
-
-