-
公开(公告)号:CN112149413A
公开(公告)日:2020-12-29
申请号:CN202010932371.9
申请日:2020-09-07
申请人: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC分类号: G06F40/284 , G06F40/289 , G06F40/30 , G06F40/216 , G06N3/04 , G06N3/08
摘要: 本发明提供一种基于神经网络识别互联网网站所属业态的方法、装置以及计算机可读存储介质。该方法包括:获取互联网网站业态的文本数据集,从所述文本数据集中提取文本特征词;基于所述文本特征词对所述文本特征词进行词向量化以获取词向量序列;将所述词向量序列分别输入递归神经网络及卷积神经网络模型,分别得到所述递归神经网络及卷积神经网络模型输出的目标特征向量,并将所述目标特征向量进行并联拼接;将已拼接的所述目标特征向量输入全连接神经网络,最后输出概率预测向量;查找所述概率预测向量中的最大值,并以所述最大值对应的业态作为所述互联网网站的所属业态。通过本发明,实现了高精度识别互联网网站的所属业态。