一种基于深度学习的互联网网站自动分类方法

    公开(公告)号:CN108364028A

    公开(公告)日:2018-08-03

    申请号:CN201810181807.8

    申请日:2018-03-06

    Abstract: 本发明涉及一种基于深度学习的互联网网站自动分类方法,根据DNS服务器日志采集大量互联网网站的原始描述信息作为网站数据集,并进行预处理和人工打标签,然后提取用于输入深度学习模型的每个网站的高维特征向量表示,并对每个网站增加对应的网站类别标签,并转化为类别向量;高维特征向量表示作为深度学习模型的输入,类别向量作为深度学习模型的输出,使用Adam梯度下降算法优化器监训练基于LSTM的循环神经网络深度学习模型;在已训练好的LSTM循环神经网络深度学习模型后增加一层SoftMax回归;将概率分布向量中概率值最大的维度对应的网站类别作为网站类别,并将输出的网站类别与网站实际的类别进行比较,得到互联网网站的分类准确率。

Patent Agency Ranking