一种海量数据预处理方法及其系统

    公开(公告)号:CN102799682B

    公开(公告)日:2015-01-07

    申请号:CN201210260651.5

    申请日:2012-07-25

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种海量数据预处理方法及其系统,通过以相关系数作为数据降维和压缩的依据,有效的利用的属性之间的相关性。将海量数据以时间片轮转的方式进行存储和顺序编号,通过随机数生成算法和取模运算后,确定抽样样本的编号。提取样本后进行相关性的分析,将属性间的相关系数作为属性相关性矩阵的值,通过相关系数的计算得到体现属性相关性的权值。权值越大即属性的相关性越强,反之亦然。以相关性分析为基础,将相关性强的属性在降维过程中吸收掉,将相关性弱的属性进行聚类分析,有效的利用属性相关性,在保持原数据内在信息的基础上,实现海量数据的降维和压缩。

    一种基于自学习的Linux安全策略配置方法

    公开(公告)号:CN103176817A

    公开(公告)日:2013-06-26

    申请号:CN201210563375.X

    申请日:2012-12-21

    IPC分类号: G06F9/445 H04L12/24 H04L29/06

    摘要: 本发明针对Linux操作系统安全策略配置困难的问题,提出一种基于自学习的Linux安全策略配置方法,以简化系统配置的工作流程。本发明在SELinux的安全服务器区嵌入策略学习模块;该模块对配置管理员用户提供了一个自动学习开关,使得安全服务器通过判断开关状态来自动生成访问控制策略。开关处于开启状态时,记录LSM拦截的所有主客体之间的访问请求,自动生成相应的访问控制策略,同时放行请求;当开关关闭,策略学习模块将不发挥作用,安全服务器将返回现有的访问控制策略。本发明自学习模式生成的策略均满足主体最小权限要求,最大可能避免了人工配置出现错误所带来的安全或稳定方面的隐患,进一步提升了系统的安全性。

    一种海量数据预处理方法及其系统

    公开(公告)号:CN102799682A

    公开(公告)日:2012-11-28

    申请号:CN201210260651.5

    申请日:2012-07-25

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种海量数据预处理方法及其系统,通过以相关系数作为数据降维和压缩的依据,有效的利用的属性之间的相关性。将海量数据以时间片轮转的方式进行存储和顺序编号,通过随机数生成算法和取模运算后,确定抽样样本的编号。提取样本后进行相关性的分析,将属性间的相关系数作为属性相关性矩阵的值,通过相关系数的计算得到体现属性相关性的权值。权值越大即属性的相关性越强,反之亦然。以相关性分析为基础,将相关性强的属性在降维过程中吸收掉,将相关性弱的属性进行聚类分析,有效的利用属性相关性,在保持原数据内在信息的基础上,实现海量数据的降维和压缩。