-
公开(公告)号:CN103795592B
公开(公告)日:2017-01-25
申请号:CN201410027720.7
申请日:2014-01-21
申请人: 中国科学院信息工程研究所
IPC分类号: H04L12/26
摘要: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。
-
公开(公告)号:CN103745002A
公开(公告)日:2014-04-23
申请号:CN201410035139.X
申请日:2014-01-24
申请人: 中国科学院信息工程研究所
CPC分类号: G06F17/30861 , G06N3/088
摘要: 本发明涉及一种基于行为特征与内容特征融合的水军识别方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据;利用马尔可夫链蒙特卡罗随机模型进行行为特征维度和内容特征维度的融合,组成用户特征向量;利用用户特征向量进行DBN模型训练,得到DBN模型;对DBN模型进行检测,判断检测结果是否达到预定标准,如果是则结束;否则根据检测结果生成相应的调节命令,分别调节特征融合阶段和DBN模型训练阶段的相关参数;在DBN训练过程中根据识别准确率不断优化行为特征与内容特征的比例分配,具体特征的选取,以及对DBN模型训练过程中迭代次数的调整,达到较优的训练效果,最终提高识别准确率和识别方法的自适应性。
-
公开(公告)号:CN103812872B
公开(公告)日:2016-11-23
申请号:CN201410073426.X
申请日:2014-02-28
申请人: 中国科学院信息工程研究所
摘要: 本发明涉及一种基于混合狄利克雷过程的网络水军行为检测方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示构成用户的历史行为向量,构成待聚类用户数据集;对待聚类用户数据集中的历史行为向量进行聚类,得到至少一个分类用户行为集合;将所有分类用户行为集合中的数据进行转换,对转换后的数据中具有相同用户标识的数据合并,得到序列数据库;模式挖掘模块对序列数据库进行序列模式挖掘,得到分别对应每个分类用户行为集合的至少一个事务序列模式;水军判断模块比较每个事务序列模式,就可以判断出哪个分类用户行为集合是水军账号。本发明很容易分辨出哪一类属于水军账号。
-
公开(公告)号:CN104008136A
公开(公告)日:2014-08-27
申请号:CN201410191247.6
申请日:2014-05-07
申请人: 中国科学院信息工程研究所
IPC分类号: G06F17/30
CPC分类号: G06F17/30657
摘要: 本发明提供一种文本快速查找的方法和装置,包括:优化数据存储结构,建立有限状态自动机,存储每个状态的单链表;存储扇出系数大于指定阈值的单链表Vi的字符域和状态域,其中i为单链表节点状态域的值,i≥0且取整数,将其转化为线性表Li且释放所述单链表Vi的存储空间,对所述线性表Li的字符域进行排序;计算所述有限状态自动机的跳转函数、失效函数和输出函数,其中,计算所述跳转函数时,若当前状态等于所述单链表Vi的状态域,对所述线性表Li进行二分查找;完成文本的匹配和查找。本发明加快了下一状态的跳转速度,既降低了AC算法的空间复杂度,减少了内存消耗,又提高了算法的效率。
-
公开(公告)号:CN103795592A
公开(公告)日:2014-05-14
申请号:CN201410027720.7
申请日:2014-01-21
申请人: 中国科学院信息工程研究所
IPC分类号: H04L12/26
摘要: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。
-
公开(公告)号:CN103716204B
公开(公告)日:2017-02-08
申请号:CN201310712975.2
申请日:2013-12-20
申请人: 中国科学院信息工程研究所
摘要: 本发明涉及一种基于维纳过程的异常入侵检测集成学习方法,包括以下步骤:选择网络流量数据集;将每个网络流量样本及其样本概率分布输入到未初始化的神经网络分类器或者经过上次训练得到的神经网络弱分类器中,判断神经网络弱分类器对每个网络流量样本是否分类错误,调整每个网络流量样本的数量及样本概率分布;反复执行步骤2,得到多个神经网络弱分类器;分别确定每个神经网络弱分类器的权重;根据每个弱分类器及每个弱分类器对应的权重,得到强分类器;将待检测网络数据流输入到强分类器中,得到入侵检测结果;重复执行步骤6,直至所有待检测网络数据流检测完毕。本发明能够解决不平衡数据集的分类问题、得到分类正确率较高的无偏分类器。
-
公开(公告)号:CN104008401A
公开(公告)日:2014-08-27
申请号:CN201410191249.5
申请日:2014-05-07
申请人: 中国科学院信息工程研究所
摘要: 本发明涉及一种图像文字识别的方法及装置,包括将获取到的不同格式的文字图像进行图像解析生成格式统一的TIFF图像;对所述TIFF图像进行图像处理得到二值图像;对所述二值图像进行矢量转换,获取所述二值图像像素阵列对应的矢量数据;将所述矢量数据与预设的英文或汉字的矢量库进行模式匹配,获取匹配的文字结果。采用本发明提出的方法及装置,能够有效识别文档图像中的文字部分,方便图像文字文档的二次编辑和处理,实现对文档图像的识别速度快、效率高、准确率好、应用范围广的效果。
-
公开(公告)号:CN103617235A
公开(公告)日:2014-03-05
申请号:CN201310611396.9
申请日:2013-11-26
申请人: 中国科学院信息工程研究所
IPC分类号: G06F17/30
CPC分类号: G06F17/3089
摘要: 本发明涉及一种基于粒子群算法的网络水军账号识别方法,具体包括以下步骤:步骤1:收集β个用户的用户信息,从所述每个用户信息中提取λ个相关指标,得到β个指标向量;步骤2:对λ个指标根据需要分配权重,得到权重向量;步骤3:将β个指标向量按照其中每个指标大小进行排序,得到λ个序列;步骤4:选取每个用户为粒子,应用粒子群算法,将符合条件的粒子保存到水军用户列表;步骤5:选取水军用户列表中所有可疑水军用户,将符合条件的所有邻居加入水军用户列表。本发明在实时性方面,本发明提出的基于改进粒子群算法的网络水军账号识别方法更为适宜。
-
公开(公告)号:CN104008401B
公开(公告)日:2018-05-18
申请号:CN201410191249.5
申请日:2014-05-07
申请人: 中国科学院信息工程研究所
摘要: 本发明涉及一种图像文字识别的方法及装置,包括将获取到的不同格式的文字图像进行图像解析生成格式统一的TIFF图像;对所述TIFF图像进行图像处理得到二值图像;对所述二值图像进行矢量转换,获取所述二值图像像素阵列对应的矢量数据;将所述矢量数据与预设的英文或汉字的矢量库进行模式匹配,获取匹配的文字结果。采用本发明提出的方法及装置,能够有效识别文档图像中的文字部分,方便图像文字文档的二次编辑和处理,实现对文档图像的识别速度快、效率高、准确率好、应用范围广的效果。
-
公开(公告)号:CN104008336B
公开(公告)日:2017-04-12
申请号:CN201410191246.1
申请日:2014-05-07
申请人: 中国科学院信息工程研究所
IPC分类号: G06F21/56
摘要: 本发明提供一种ShellCode检测方法和装置,包括:建立包含ShellCode特征序列的ShellCode指令序列特征库;载入待检测文件,对所述待检测文件进行解析,形成解析文件;对所述解析文件进行指令的模拟执行和分析,记录可疑指令序列并与所述ShellCode指令序列特征库中的ShellCode特征序列进行对比,判断所述解析文件中是否包含ShellCode;输出检测结果。本发明能够在ShellCode执行之前即进行检测,防止了ShellCode对系统造成的影响,及时阻止了其进行恶意篡改的可能性。
-
-
-
-
-
-
-
-
-