发明授权
CN103605794B 一种网站分类方法
失效 - 权利终止
- 专利标题: 一种网站分类方法
-
申请号: CN201310651985.X申请日: 2013-12-05
-
公开(公告)号: CN103605794B公开(公告)日: 2017-02-15
- 发明人: 胡俊 , 王明华 , 云晓春 , 李佳 , 贺敏 , 纪玉春 , 何能强 , 高胜 , 朱天
- 申请人: 国家计算机网络与信息安全管理中心
- 申请人地址: 北京市朝阳区裕民路甲3号
- 专利权人: 国家计算机网络与信息安全管理中心
- 当前专利权人: 国家计算机网络与信息安全管理中心
- 当前专利权人地址: 北京市朝阳区裕民路甲3号
- 代理机构: 工业和信息化部电子专利中心
- 代理商 田俊峰
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06N3/02
摘要:
本发明公开了一种网站分类方法,包括:获取网站的多维属性,利用集合对多维属性进行表示;针对表示多维属性的集合,进行自编码特征学习;利用自编码学习结果,进行网站聚类学习,得到用于进行网站分类的支持向量机SVM;步骤S104,对任意一个未经标注的网站进行分类时,先进行步骤S101和步骤S102,得到与该网站对应的自编码学习结果;然后将该结构输入到步骤S103得到的SVM中,进行网站分类,得到网站的类别。本发明的网站分类方法能高效准确的按照行业类别对网站进行分类,并且能快速侦测具有恶意特征的钓鱼网页;采用多维属性描述的方式,增加系统的便利性与通用性;且系统具有极强的稳定性。
公开/授权文献
- CN103605794A 一种网站分类方法 公开/授权日:2014-02-26