数据处理的方法和装置
    1.
    发明授权

    公开(公告)号:CN103309984B

    公开(公告)日:2016-12-28

    申请号:CN201310239700.1

    申请日:2013-06-17

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30536

    摘要: 本发明公开了一种数据处理的方法和装置,属于数据处理技术领域。所述方法包括:根据主键对样本进行排序,所述主键包括特征序号和样本序号,所述主键对应的列值为样本的特征值;以所述主键和特征值为输入键值对,使用第一算法模型计算得到每个类别中的每个特征的统计量,并将特征序号和统计量作为输出键值对输出;使用第二算法模型对所述输出键值对进行计算,得到每个特征对类别的贡献值,根据所述贡献值进行特征选取。所述装置包括:排序模块、第一处理模块和第二处理模块。本发明极大地提高了数据的处理速度,降低了运算开销,通过两次算法模型计算,实现了快速特征选择。

    恶意文件识别方法、装置及存储介质

    公开(公告)号:CN102737186A

    公开(公告)日:2012-10-17

    申请号:CN201210213078.2

    申请日:2012-06-26

    IPC分类号: G06F21/00

    摘要: 本发明公开一种恶意文件识别方法、装置及存储介质,其方法包括:采用预定的恶意文件和正常文件组成的学习集生成机器学习模型;读取学习集以外的待检测文件;将待检测文件转化成向量;通过机器学习模型对转化成向量的待检测文件进行恶意文件识别。本发明通过预先设定的恶意文件和正常文件组成的学习集生成机器学习模型,通过生成的机器学习模型对学习集以外的待检测文件进行恶意文件识别,可及时、准确并有效的提取病毒特征,对发现的任何恶意文件可立即处理,由此极大的提升了恶意文件的检测效率。

    数据处理的方法和装置
    4.
    发明公开

    公开(公告)号:CN103309984A

    公开(公告)日:2013-09-18

    申请号:CN201310239700.1

    申请日:2013-06-17

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30536

    摘要: 本发明公开了一种数据处理的方法和装置,属于数据处理技术领域。所述方法包括:根据主键对样本进行排序,所述主键包括特征序号和样本序号,所述主键对应的列值为样本的特征值;以所述主键和特征值为输入键值对,使用第一算法模型计算得到每个类别中的每个特征的统计量,并将特征序号和统计量作为输出键值对输出;使用第二算法模型对所述输出键值对进行计算,得到每个特征对类别的贡献值,根据所述贡献值进行特征选取。所述装置包括:排序模块、第一处理模块和第二处理模块。本发明极大地提高了数据的处理速度,降低了运算开销,通过两次算法模型计算,实现了快速特征选择。

    一种程序文件的处理方法及装置

    公开(公告)号:CN106897616B

    公开(公告)日:2021-07-16

    申请号:CN201510956497.9

    申请日:2015-12-17

    IPC分类号: G06F21/56 G06F16/35

    摘要: 本发明实施例公开了程序文件的处理方法及装置,应用于信息处理技术领域。在本实施例的程序文件处理方法中,先获取样本程序文件的函数依赖图,并根据函数依赖图所包括的多个节点中各个邻接节点之间的关系信息,获取函数依赖图的第一特征向量,最后可以将第一特征向量应用到待处理程序文件的聚类或分类处理中。这样如果将样本程序文件的函数依赖图的特征作为识别恶意程序文件的基准,可以应对恶意程序文件的更新和新出现的恶意程序文件;进一步为了减少程序文件的处理装置的计算量,且有利于后续应用中与待处理程序文件对比,本发明实施例中只是将样本程序文件的函数依赖图中所包括的邻接节点的关系特征作为聚类或分类应用的基准。

    一种信息处理方法及服务器

    公开(公告)号:CN106485146B

    公开(公告)日:2019-08-13

    申请号:CN201510555804.2

    申请日:2015-09-02

    IPC分类号: G06F21/56

    摘要: 本发明公开了一种信息处理方法及服务器,其中,所述信息处理方法包括:获取至少一个指定类型的可执行文件,从所述至少一个指定类型的可执行文件中提取至少一个第一操作指令;当所述第一操作指令的特征符合预设策略时,将所述第一操作指令确定为特征指令;提取所述特征指令的特征值,将所述特征指令的特征值用于构造病毒分类模型,分析得到病毒的结构特征参数;根据所述病毒分类模型对至少一个待检测的文件进行识别时,从所述至少一个待检测的文件中提取至少一个第二操作指令;当所述第二操作指令的特征值符合所述病毒的结构特征参数时,识别出所述待检测的文件为病毒文件。

    一种文件的聚类方法和设备

    公开(公告)号:CN104008334B

    公开(公告)日:2017-12-01

    申请号:CN201310055669.6

    申请日:2013-02-21

    发明人: 杨宜 于涛 陶波

    IPC分类号: G06F21/56

    摘要: 本发明实施例公开了文件的聚类方法和设备,应用于信息处理技术领域。本发明实施例中,在对待处理文件进行聚类时,可以通过对待处理文件中包含的多个信息块的特征的信息指纹的比较,来将信息指纹相同的待处理文件作为一个聚类,实现了文件的聚类。这样采用信息指纹的方式对待处理文件中信息块的特征进行标识,然后根据标识来进行聚类,相比现有技术中相似性比较,采用本发明实施例中计算特征的标识并聚类的运算量和复杂度会很大程度的降低。

    恶意特征提取方法、装置及存储介质

    公开(公告)号:CN103632091B

    公开(公告)日:2017-08-25

    申请号:CN201210298988.5

    申请日:2012-08-21

    IPC分类号: G06F21/56

    摘要: 本发明公开一种恶意特征提取方法、装置及存储介质,其方法包括:选取用来提取特征的黑文件集和与黑文件集数量相当的白文件集;将黑文件集中的黑文件以及白文件集中的白文件转换为多维向量;对黑文件集中的黑文件以及白文件集中的白文件的向量进行维度合并和筛选,提取恶意特征。本发明通过对已知的黑文件集和白文件集进行向量转换,并对转换的向量进行维度合并和筛选,可自动及时、准确并有效的提取病毒等恶意特征,不仅能省去大量的分析人员,而且极大地降低了人为主观因素的影响,同时在反应速度上有极大的提高。

    一种程序文件的处理方法及装置

    公开(公告)号:CN106897616A

    公开(公告)日:2017-06-27

    申请号:CN201510956497.9

    申请日:2015-12-17

    IPC分类号: G06F21/56 G06F17/30

    摘要: 本发明实施例公开了程序文件的处理方法及装置,应用于信息处理技术领域。在本实施例的程序文件处理方法中,先获取样本程序文件的函数依赖图,并根据函数依赖图所包括的多个节点中各个邻接节点之间的关系信息,获取函数依赖图的第一特征向量,最后可以将第一特征向量应用到待处理程序文件的聚类或分类处理中。这样如果将样本程序文件的函数依赖图的特征作为识别恶意程序文件的基准,可以应对恶意程序文件的更新和新出现的恶意程序文件;进一步为了减少程序文件的处理装置的计算量,且有利于后续应用中与待处理程序文件对比,本发明实施例中只是将样本程序文件的函数依赖图中所包括的邻接节点的关系特征作为聚类或分类应用的基准。