- 专利标题: 一种用于网络安全报告的文本特征模型建模方法及装置
- 专利标题(英): Text characteristic modeling method and device for network security reports
-
申请号: CN201710616406.6申请日: 2017-07-26
-
公开(公告)号: CN107368592A公开(公告)日: 2017-11-21
- 发明人: 林康 , 罗鹰 , 张鑫阳
- 申请人: 成都科来软件有限公司
- 申请人地址: 四川省成都市高新区天府大道北段966号4栋1单元13楼、14楼
- 专利权人: 成都科来软件有限公司
- 当前专利权人: 科来网络技术股份有限公司
- 当前专利权人地址: 四川省成都市高新区天府大道北段966号4栋1单元13楼、14楼
- 代理机构: 成都九鼎天元知识产权代理有限公司
- 代理商 徐静
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06K9/62
摘要:
本发明涉及文本处理领域。针对现有技术存在的问题,本发明提供一种用于网络安全报告的文本特征模型建模方法及装置。该方法或者装置是结合全文和段落信息,同时结合词频与文本特征信息,来构建特定领域的文本模型;对需要分析的网络安全报告进行网络安全分析。本发明对文档的分析主要以段落为基础,首先读取文档,计算全文的段落文本密度和关键词频,然后对每个段落提取位置信息、长度信息、关键字段信息、段向量,将这些信息组成该段落的特征向量,然后按照该特征向量对段落进行分类。在完成所有段落的分析后,即可建立起全文的数据模型。
公开/授权文献
- CN107368592B 一种用于网络安全报告的文本特征模型建模方法及装置 公开/授权日:2020-09-25