基于家族样本的病毒特征自动提取方法及系统

    公开(公告)号:CN103324888A

    公开(公告)日:2013-09-25

    申请号:CN201210072372.6

    申请日:2012-03-19

    Abstract: 本发明提供一种基于家族样本的病毒特征自动提取方法及系统,本发明对最长公共子序列算法进行改进,利用家族样本集中的样本,建立数列A、B,通过预设特征码长度,分别计算数列A、B中长度为预设值的子序列的哈希值,并通过红黑树方式对A、B数列中的子序列的哈希值匹配,若哈希值相同,则该哈希值所对应的子序列为数列A及数列B的公共子序列,则该公共子序列为家族样本特征码,当剩余样本分别作为数列B并在红黑树中查找后,得到的所有家族样本特征码组成家族样本特征集,根据建立的特征码质量评价加权模型,判断特征码质量,确定家族样本特征码。通过本发明的方法,简化了算法的时间复杂度,提高了特征码提取效率及准确度。

    二进制数据中有意义字符串提取方法和系统

    公开(公告)号:CN103544141B

    公开(公告)日:2016-09-07

    申请号:CN201210243966.9

    申请日:2012-07-16

    Inventor: 康学斌 田彻

    Abstract: 本发明公开了一种二进制数据中的字符串提取方法,包括首先从二进制数据中读取所有的可显示字符组成的字符串,然后将所提取的每个字符串拆分为可显示字符组合,计算获得字符组合的概率差异表之后,利用概率差异算法区分所有提取的字符串获得初步的有意义字符串和无意义字符串,并进一步通过熵值法去除不准确的有意义字符串则得到最终所提取的字符串结果。本发明还公开了一种二进制数据中的字符串提取系统。使用本发明的技术方案可以提取任意格式的二进制数据包括磁盘文件、磁盘镜像、网络数据等。同时可以提取人类可读的字符串,大大提高了提取字符串的效率。

    基于家族样本的病毒特征自动提取方法及系统

    公开(公告)号:CN103324888B

    公开(公告)日:2016-04-27

    申请号:CN201210072372.6

    申请日:2012-03-19

    Abstract: 本发明提供一种基于家族样本的病毒特征自动提取方法及系统,本发明对最长公共子序列算法进行改进,利用家族样本集中的样本,建立数列A、B,通过预设特征码长度,分别计算数列A、B中长度为预设值的子序列的哈希值,并通过红黑树方式对A、B数列中的子序列的哈希值匹配,若哈希值相同,则该哈希值所对应的子序列为数列A及数列B的公共子序列,则该公共子序列为家族样本特征码,当剩余样本分别作为数列B并在红黑树中查找后,得到的所有家族样本特征码组成家族样本特征集,根据建立的特征码质量评价加权模型,判断特征码质量,确定家族样本特征码。通过本发明的方法,简化了算法的时间复杂度,提高了特征码提取效率及准确度。

    二进制数据中有意义字符串提取方法和系统

    公开(公告)号:CN103544141A

    公开(公告)日:2014-01-29

    申请号:CN201210243966.9

    申请日:2012-07-16

    Inventor: 康学斌 田彻

    Abstract: 本发明公开了一种二进制数据中的字符串提取方法,包括首先从二进制数据中读取所有的可显示字符组成的字符串,然后将所提取的每个字符串拆分为可显示字符组合,计算获得字符组合的概率差异表之后,利用概率差异算法区分所有提取的字符串获得初步的有意义字符串和无意义字符串,并进一步通过熵值法去除不准确的有意义字符串则得到最终所提取的字符串结果。本发明还公开了一种二进制数据中的字符串提取系统。使用本发明的技术方案可以提取任意格式的二进制数据包括磁盘文件、磁盘镜像、网络数据等。同时可以提取人类可读的字符串,大大提高了提取字符串的效率。

Patent Agency Ranking