一种用于网络安全报告的文本特征模型建模方法及装置
摘要:
本发明涉及文本处理领域。针对现有技术存在的问题,本发明提供一种用于网络安全报告的文本特征模型建模方法及装置。该方法或者装置是结合全文和段落信息,同时结合词频与文本特征信息,来构建特定领域的文本模型;对需要分析的网络安全报告进行网络安全分析。本发明对文档的分析主要以段落为基础,首先读取文档,计算全文的段落文本密度和关键词频,然后对每个段落提取位置信息、长度信息、关键字段信息、段向量,将这些信息组成该段落的特征向量,然后按照该特征向量对段落进行分类。在完成所有段落的分析后,即可建立起全文的数据模型。
0/0