基于N元词组相似性的软件漏洞特征知识抽取方法及系统

    公开(公告)号:CN116561332A

    公开(公告)日:2023-08-08

    申请号:CN202211605951.2

    申请日:2022-12-12

    申请人: 扬州大学

    摘要: 本发明公开了一种基于N元词组相似性的软件漏洞特征知识抽取方法及系统,首先采集漏洞数据库中的漏洞描述文本,进行数据清洗生成漏洞关键特征描述文本;再进行N元候选关键词抽取,利用词与文本的语义相似度生成漏洞特征描述候选关键词;其次进行关键词实体抽取,构建文本相似度模型,将文本中的候选关键词使用MASK操作后计算与标准漏洞描述文本的相似度,对文本按相似度进行排序,生成漏洞特征描述实体关键词;定义漏洞特征实体关系,生成表示漏洞特征关系的三元组;利用三元组构建知识图谱,利用该知识图谱对待分析漏洞文本进行分析。本发明可以更好的帮助分析漏洞特征,提高软件系统安全性。