具有明显类别划分的非结构化电子文档的检索方法和系统

    公开(公告)号:CN103020213A

    公开(公告)日:2013-04-03

    申请号:CN201210525908.5

    申请日:2012-12-07

    IPC分类号: G06F17/30

    摘要: 本发明提供一种有明显类别划分的非结构化电子文档的检索方法和系统,其方法包括文档分类和类型关键词识别阶段:文档分类是将特定集合的文档,按照各文档内容之间存在的关系进行分类;类型关键词识别是将所有类型的关键词识别出来;实时搜索阶段:根据用户输入的搜索词,查询符合搜索结果的文档,并按照文档相关性从高到低返回搜索结果,该阶段提供了一实时搜索相关性算法公式,公式中引入了搜索词与文档类别的关系,优化了TF-IDF算法,很大程度上解决了上述提到的两个TF-IDF用于大型企业电子文档搜索时存在的两个问题,使之适用于大型企业电子文档全文搜索。

    一种通用的全文搜索方法
    33.
    发明授权

    公开(公告)号:CN102968501B

    公开(公告)日:2016-02-17

    申请号:CN201210525753.5

    申请日:2012-12-07

    IPC分类号: G06F17/30

    摘要: 本发明提供一种通用的全文搜索方法,包括数据准备阶段:以业务系统作为分类条件建立多个分类信息数据表,各分类信息数据表之间两两设置关联描述字段;索引创建阶段:业务系统提交电子文件到电子文件管理平台时,将触发该电子文件管理平台的索引创建装置,开始抽取电子文件内容,并分别建立该电子文件的元数据索引库和内容索引库,并建立元数据索引库和内容索引库的关联关系,通过元数据索引库进行访问授权控制;数据搜索阶段:通过所述分类信息数据表及其关联描述字段对分类检索进行授权控制和用户认证。从而实现了在同一个系统中可以灵活设置搜索访问权限,满足了多种方式的授权访问控制要求,可以实现用户对不需要授权的文件的访问。

    一种电子文档安全管理系统及方法

    公开(公告)号:CN103530570A

    公开(公告)日:2014-01-22

    申请号:CN201310439495.3

    申请日:2013-09-24

    IPC分类号: G06F21/62

    摘要: 一种电子文档安全管理系统及方法,包括驱动层透明加解密模块、应用层安全控制及透明加解密模块、智能文件和进程特征识别模块、文件外发离线控制模块、文件屏幕水印及打印水印控制模块、安全策略管理模块、密钥管理模块;系统核心技术是在客户端的驱动管理,位于Windows操作系统的核心态运行,被I/O管理器为满足系统对文件系统的需求而调用;系统的数据加密平台将接管整个Windows操作系统的文件系统,负责为文件系统提供实时地透明加解密数据的服务。本发明提供一种电子文档安全管理系统及方法,通过改进电子文档安全保护措施,引入透明加解密方法,实现电子文档离线高的安全性和用户友好性。