发明公开
- 专利标题: 一种基于网络关系图的网站分类方法
- 专利标题(英): Website classification method based on network relation graph
-
申请号: CN201610831775.2申请日: 2016-09-19
-
公开(公告)号: CN106446124A公开(公告)日: 2017-02-22
- 发明人: 杨珩
- 申请人: 成都知道创宇信息技术有限公司
- 申请人地址: 四川省成都市高新区天府大道中段801号5幢8层
- 专利权人: 成都知道创宇信息技术有限公司
- 当前专利权人: 成都知道创宇信息技术有限公司
- 当前专利权人地址: 四川省成都市高新区天府大道中段801号5幢8层
- 代理机构: 成都信博专利代理有限责任公司
- 代理商 张辉; 崔建中
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种基于网络关系图的网站分类方法,包括以下步骤:以“安全联盟”的恶意数据作为样本数据源,获取已有的数据分类和URL数据;形成站点映射表和词频分析表、提取样本指纹特征,用于构建特征表、形成类型表;由各站点和其连接权重构成一个无向权重图;众多的站点和权重构成一个网络关系图,通过图聚类算法把一个大图分成若干个子图;各任务单元在各自的服务器上通过站点指纹特征提取器和分类器来抽取指纹特征并分类。本发明显著地提高网站分类的检测速度,区分具体类型;对于不断新增的站点,依据其与现有的连接关系来确定处理单元,有效地减少计算复杂度以及训练的迭代次数,节省计算资源。
公开/授权文献
- CN106446124B 一种基于网络关系图的网站分类方法 公开/授权日:2019-11-15