基于深度学习的钓鱼网页层次化检测方法及系统
摘要:
本发明属于网络安全技术领域,特别涉及一种基于深度学习的钓鱼网页层次化检测方法及系统,包含:利用黑名单对待测URL进行匹配,拦截已知钓鱼网页;基于敏感词对待测URL分词,并通过词嵌入矩阵将分词后的URL转化为特征向量矩阵;利用已训练的卷积神经网络CNN提取特征向量矩阵中的局部特征,并结合双向长短记忆网络Bi‑LSTM提取特征向量中的长距离依赖特征;针对长距离依赖特征,利用网络全连接层来获取待测URL属于钓鱼网页的概率并判定待测URL类型。本发明结合黑名单和深度学习的优点,通过拦截并自动提取特征检测未知的钓鱼网页,检测模型提取更为充分的特征,提升对钓鱼网页的检测能力,检测速度快、准确率高,具有较好的应用前景。
0/0