-
公开(公告)号:CN118940145A
公开(公告)日:2024-11-12
申请号:CN202410943933.8
申请日:2024-07-15
Applicant: 中国科学院软件研究所
IPC: G06F18/2415 , G06F18/28 , G06F40/289 , G06F18/22 , G06F18/213 , G06F18/25 , G06N3/045 , G06N3/047
Abstract: 本发明公开了一种威胁数据的分类分级识别方法及系统,属于自然语言处理领域。本发明构建精细化的网络安全数据字典,对获取的网络流量数据进行词典的词语匹配确定命中文本,再通过Bert模型和相似度计算获取相似度最高的命中文本,然后将拼接特征经过信息融合和特征值指数运算确定类别,再然后经过特征提取并与观测属性匹配确定重要程度级别,最后经过敏感度分数计算确定具体的等级。本发明实现了对网络流量的威胁数据的特征精准刻画和精准分类分级。