一种基于网络关系图的网站分类方法
摘要:
本发明公开了一种基于网络关系图的网站分类方法,包括以下步骤:以“安全联盟”的恶意数据作为样本数据源,获取已有的数据分类和URL数据;形成站点映射表和词频分析表、提取样本指纹特征,用于构建特征表、形成类型表;由各站点和其连接权重构成一个无向权重图;众多的站点和权重构成一个网络关系图,通过图聚类算法把一个大图分成若干个子图;各任务单元在各自的服务器上通过站点指纹特征提取器和分类器来抽取指纹特征并分类。本发明显著地提高网站分类的检测速度,区分具体类型;对于不断新增的站点,依据其与现有的连接关系来确定处理单元,有效地减少计算复杂度以及训练的迭代次数,节省计算资源。
公开/授权文献
0/0