-
公开(公告)号:CN103309984B
公开(公告)日:2016-12-28
申请号:CN201310239700.1
申请日:2013-06-17
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30536
摘要: 本发明公开了一种数据处理的方法和装置,属于数据处理技术领域。所述方法包括:根据主键对样本进行排序,所述主键包括特征序号和样本序号,所述主键对应的列值为样本的特征值;以所述主键和特征值为输入键值对,使用第一算法模型计算得到每个类别中的每个特征的统计量,并将特征序号和统计量作为输出键值对输出;使用第二算法模型对所述输出键值对进行计算,得到每个特征对类别的贡献值,根据所述贡献值进行特征选取。所述装置包括:排序模块、第一处理模块和第二处理模块。本发明极大地提高了数据的处理速度,降低了运算开销,通过两次算法模型计算,实现了快速特征选择。
-
公开(公告)号:CN102737186A
公开(公告)日:2012-10-17
申请号:CN201210213078.2
申请日:2012-06-26
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F21/00
摘要: 本发明公开一种恶意文件识别方法、装置及存储介质,其方法包括:采用预定的恶意文件和正常文件组成的学习集生成机器学习模型;读取学习集以外的待检测文件;将待检测文件转化成向量;通过机器学习模型对转化成向量的待检测文件进行恶意文件识别。本发明通过预先设定的恶意文件和正常文件组成的学习集生成机器学习模型,通过生成的机器学习模型对学习集以外的待检测文件进行恶意文件识别,可及时、准确并有效的提取病毒特征,对发现的任何恶意文件可立即处理,由此极大的提升了恶意文件的检测效率。
-
公开(公告)号:CN103336786A
公开(公告)日:2013-10-02
申请号:CN201310221032.X
申请日:2013-06-05
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/3071
摘要: 本发明公开了一种数据处理的方法,包括:对接收到的每个数据进行指纹计算,得到所述每个数据的指纹信息;按照所述指纹信息,将具有相同指纹信息的数据划分到同一数据组;从划分后的每一数据组中选择一个数据用于建模计算。本发明实施例还提供相应的装置。本发明技术方案由于可以减少用于建模计算的数据量,从而降低了数据处理的时间,提高了数据处理的效率。
-
公开(公告)号:CN103309984A
公开(公告)日:2013-09-18
申请号:CN201310239700.1
申请日:2013-06-17
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/30536
摘要: 本发明公开了一种数据处理的方法和装置,属于数据处理技术领域。所述方法包括:根据主键对样本进行排序,所述主键包括特征序号和样本序号,所述主键对应的列值为样本的特征值;以所述主键和特征值为输入键值对,使用第一算法模型计算得到每个类别中的每个特征的统计量,并将特征序号和统计量作为输出键值对输出;使用第二算法模型对所述输出键值对进行计算,得到每个特征对类别的贡献值,根据所述贡献值进行特征选取。所述装置包括:排序模块、第一处理模块和第二处理模块。本发明极大地提高了数据的处理速度,降低了运算开销,通过两次算法模型计算,实现了快速特征选择。
-
公开(公告)号:CN106897616B
公开(公告)日:2021-07-16
申请号:CN201510956497.9
申请日:2015-12-17
申请人: 腾讯科技(深圳)有限公司
摘要: 本发明实施例公开了程序文件的处理方法及装置,应用于信息处理技术领域。在本实施例的程序文件处理方法中,先获取样本程序文件的函数依赖图,并根据函数依赖图所包括的多个节点中各个邻接节点之间的关系信息,获取函数依赖图的第一特征向量,最后可以将第一特征向量应用到待处理程序文件的聚类或分类处理中。这样如果将样本程序文件的函数依赖图的特征作为识别恶意程序文件的基准,可以应对恶意程序文件的更新和新出现的恶意程序文件;进一步为了减少程序文件的处理装置的计算量,且有利于后续应用中与待处理程序文件对比,本发明实施例中只是将样本程序文件的函数依赖图中所包括的邻接节点的关系特征作为聚类或分类应用的基准。
-
公开(公告)号:CN106485146B
公开(公告)日:2019-08-13
申请号:CN201510555804.2
申请日:2015-09-02
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F21/56
CPC分类号: G06F21/564 , G06F21/56 , G06F21/563 , G06F21/567 , G06F2221/033
摘要: 本发明公开了一种信息处理方法及服务器,其中,所述信息处理方法包括:获取至少一个指定类型的可执行文件,从所述至少一个指定类型的可执行文件中提取至少一个第一操作指令;当所述第一操作指令的特征符合预设策略时,将所述第一操作指令确定为特征指令;提取所述特征指令的特征值,将所述特征指令的特征值用于构造病毒分类模型,分析得到病毒的结构特征参数;根据所述病毒分类模型对至少一个待检测的文件进行识别时,从所述至少一个待检测的文件中提取至少一个第二操作指令;当所述第二操作指令的特征值符合所述病毒的结构特征参数时,识别出所述待检测的文件为病毒文件。
-
公开(公告)号:CN104008334B
公开(公告)日:2017-12-01
申请号:CN201310055669.6
申请日:2013-02-21
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F21/56
CPC分类号: G06F17/30598 , G06F17/30097 , G06F17/30115 , G06F17/30138 , G06F17/30628 , G06F17/30705
摘要: 本发明实施例公开了文件的聚类方法和设备,应用于信息处理技术领域。本发明实施例中,在对待处理文件进行聚类时,可以通过对待处理文件中包含的多个信息块的特征的信息指纹的比较,来将信息指纹相同的待处理文件作为一个聚类,实现了文件的聚类。这样采用信息指纹的方式对待处理文件中信息块的特征进行标识,然后根据标识来进行聚类,相比现有技术中相似性比较,采用本发明实施例中计算特征的标识并聚类的运算量和复杂度会很大程度的降低。
-
公开(公告)号:CN103632091B
公开(公告)日:2017-08-25
申请号:CN201210298988.5
申请日:2012-08-21
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F21/56
摘要: 本发明公开一种恶意特征提取方法、装置及存储介质,其方法包括:选取用来提取特征的黑文件集和与黑文件集数量相当的白文件集;将黑文件集中的黑文件以及白文件集中的白文件转换为多维向量;对黑文件集中的黑文件以及白文件集中的白文件的向量进行维度合并和筛选,提取恶意特征。本发明通过对已知的黑文件集和白文件集进行向量转换,并对转换的向量进行维度合并和筛选,可自动及时、准确并有效的提取病毒等恶意特征,不仅能省去大量的分析人员,而且极大地降低了人为主观因素的影响,同时在反应速度上有极大的提高。
-
公开(公告)号:CN106897616A
公开(公告)日:2017-06-27
申请号:CN201510956497.9
申请日:2015-12-17
申请人: 腾讯科技(深圳)有限公司
CPC分类号: G06F21/565 , G06F17/3071 , G06F2221/033
摘要: 本发明实施例公开了程序文件的处理方法及装置,应用于信息处理技术领域。在本实施例的程序文件处理方法中,先获取样本程序文件的函数依赖图,并根据函数依赖图所包括的多个节点中各个邻接节点之间的关系信息,获取函数依赖图的第一特征向量,最后可以将第一特征向量应用到待处理程序文件的聚类或分类处理中。这样如果将样本程序文件的函数依赖图的特征作为识别恶意程序文件的基准,可以应对恶意程序文件的更新和新出现的恶意程序文件;进一步为了减少程序文件的处理装置的计算量,且有利于后续应用中与待处理程序文件对比,本发明实施例中只是将样本程序文件的函数依赖图中所包括的邻接节点的关系特征作为聚类或分类应用的基准。
-
公开(公告)号:CN106709336A
公开(公告)日:2017-05-24
申请号:CN201510796066.0
申请日:2015-11-18
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F21/56
CPC分类号: G06F21/563 , G06F8/10 , G06F8/20 , G06F8/427 , G06F8/53 , G06F8/61 , G06F8/75 , G06F21/566 , G06F21/62 , G06N5/003 , G06N5/04 , G06N20/20
摘要: 本发明公开了一种识别恶意软件的方法和装置,属于计算机技术领域。所述方法包括:根据待检测的软件的源代码,获取所述软件的函数调用图;根据所述函数调用图,生成所述软件的特征序列,所述特征序列包括至少一个特征的特征值,特征为预设函数库中的函数,所述特征的特征值为所述函数被所述软件调用的次数;根据所述特征序列和随机森林,识别所述软件是否为恶意软件,所述随机森林包括至少一个决策树,决策树包括多个特征的基准特征值。所述装置包括:获取模块,生成模块和识别模块。本发明可以提高识别准确率。
-
-
-
-
-
-
-
-
-