-
公开(公告)号:CN108429649A
公开(公告)日:2018-08-21
申请号:CN201810244277.7
申请日:2018-03-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L12/24
CPC classification number: H04L41/0631 , H04L41/064
Abstract: 本发明公开了一种基于多次单类型采集结果的综合异常判断系统,涉及网络预警技术领域。所述系统包括:阈值生成单元和异常判断单元;所述阈值生成单元,在从被采集系统上获取到的采集数据的基础上,计算判断阈值;所述异常判断单元,在所述判断阈值和所述采集数据的基础上,判断被采集系统运行是正常还是异常。本发明所述系统对采集到的数据进行多种方式进行判断,从而在不接触被监测系统后台日志或硬件数据的情况下准确识别出被检测系统的运行状况,解决了因使用平均值计算抗干扰性太弱,固定阈值判断性能太差,阈值波动范围设置方案单一且低效的问题。
-
公开(公告)号:CN104778209B
公开(公告)日:2018-04-27
申请号:CN201510111752.X
申请日:2015-03-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种针对千万级规模新闻评论的观点挖掘方法。具体步骤如下:1)、统计千万级规模新闻评论的数量;2)、判断该数量是否大于或等于阈值K,如果是不予处理,否则进入步骤三;3)、利用中文分词工具,对数量小于阈值K的新闻标题和评论进行分词,进行词性标注;4)、根据分词结果对新闻评论聚类,得到类别标签;5)、对新闻评论进行关键词对提取;6)、统计新闻评论的比例和混杂度;7)、根据关键词对筛选并提取代表性文本。本发明利用中文分词工具,考虑汉语语言的用法和搭配关系,结合新闻标题的作用,处理千万级规模的新闻评论,具有高效性、鲁棒性和易用性等优点。
-
公开(公告)号:CN106503859A
公开(公告)日:2017-03-15
申请号:CN201610963409.2
申请日:2016-10-28
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于在线社会关系网络的消息传播预测方法及装置,涉及社交媒体及大数据技术领域,该方法包括步骤1,对于一条消息d,获取其发出后在[0,T]时间段内,用户对其关注行为到达的时间序列;步骤2,对所述时间序列进行建模,对建模生成的模型进行学习,训练出所述模型的模型参数,根据所述模型参数,获取消息流行度预测函数。本发明能够应对数据涌发现象;通过MAPE对比,该方法准确率更高;形式灵活,可以应用到其他应用场景。
-
公开(公告)号:CN103761246B
公开(公告)日:2017-02-08
申请号:CN201310705515.7
申请日:2013-12-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提出一种基于链接网络的用户领域识别方法及其装置,属于数据发掘及复杂网络领域。装置包括数据收集与预处理模块,领域原型用户集合构建模块和用户领域计算模块。方法包括:步骤1,手工采集初始种子用户;步骤2,收集种子用户的关注用户;步骤3,构建链接网络,计算各关注用户对于各领域的隶属度;步骤4,按隶属度大小将用户排序;步骤5,为各领域构建领域原型用户集合;步骤6,收集待分类用户的关注用户;步骤7,计算待分类用户对于各领域的隶属度;步骤8,将领域隶属度大小排序;步骤9,加领域标签。本发明适用于多种社交网络平台,能够克服短文本的缺点,特别适合用户建模,个性化信息搜索和推荐等领域。
-
公开(公告)号:CN106168969A
公开(公告)日:2016-11-30
申请号:CN201610524367.2
申请日:2016-07-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明提供一种信源重要度的评级方法及评级系统,评级方法包括:步骤1,计算信源所属网站的网站重要度值W1;步骤2,计算信源在所属行业的行业重要度值W2;步骤3,预设定网站重要度权重值C1和行业重要度权重值C2;根据下式计算得到信源重要度值M:信源重要度值M=网站重要度值W1*网站重要度权重值C1+行业重要度值W2*行业重要度权重值C2;步骤4,根据信源重要度值M对信源进行重要度评级,并输出信源重要度评级结果。优点为:本发明能够对信源进行客观、科学合理、有效实用的信源重要度评级。
-
公开(公告)号:CN106126605A
公开(公告)日:2016-11-16
申请号:CN201610453205.4
申请日:2016-06-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明公开了一种基于用户画像的短文本分类方法。本方法为:1)基于用户发出的短文本数据生成对应用户的用户画像;其中,用户ui的用户画像为用户ui属于类别ci的值;2)采用分类器对该用户ui的短文本TS进行分类,得到该短文本TS所属类别的可能性F={f1,...,fi,...,fm};3)根据用户ui的用户画像与F={f1,...,fi,...,fm}计算该短文本TS属于各类别的值,选出最大的类别结果作为该短文本TS的类别标签。本发明大大增加了分类的准确率。
-
公开(公告)号:CN105843854A
公开(公告)日:2016-08-10
申请号:CN201610150817.6
申请日:2016-03-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提供一种面向网络数据的专题文档快速识别系统,通过与不同规则的高效匹配达到快速识别专题的目的。本发明主要由文档获取模块、文档结果存储模块、轮询监测模块、实时服务接口、历史服务接口、规则树构建模块、实时过滤处理模块和回溯过滤处理模块组成。本发明实现了对实时数据和历史有效数据同时进行处理的功能,能够对大量文档数据进行批量处理,能够在保证系统正常运行的前提下对处理算法进行动态热切换,能够在输入输出接口内容变动后依然可以保证系统的正常运行,弥补了目前一些文档识别系统无法随意更改、灵活性和复用性差等的缺陷,对需求变更有很强的适应性。
-
公开(公告)号:CN105740236A
公开(公告)日:2016-07-06
申请号:CN201610066957.5
申请日:2016-01-29
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
CPC classification number: G06F17/2715 , G06F17/2775
Abstract: 本发明公开了一种结合写作特征和序列特征的中文情感新词识别方法和系统。该方法对于输入文本子句,基于情感词的作者写作特征和情感词的序列特征将文本子句表示为各种特征(如:字、词性等)的序列。然后,针对特征表示的文本子句,利用线性链条件随机场模型输出与文本子句对应的情感词标签序列。其中,线性链条件随机场模型基于包含传统情感词的文本训练得到。接着,基于文本子句中字的序列和情感词标签序列,利用有限状态自动机识别文本子句中的情感词,形成情感词集合。最后,利用中文旧词词库对情感词集合进行过滤,将未出现在中文旧词词库中的情感词作为中文情感新词。通过本发明实施例解决了如何提高情感新词识别精度和召回率的技术问题。
-
公开(公告)号:CN105608106A
公开(公告)日:2016-05-25
申请号:CN201510744624.9
申请日:2015-11-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明公开了一种面向智能终端的舆情分析方法。包括:获取用户预先设定的关键词,然后根据该关键词获取包括该关键词的新闻,再根据获取的新闻通过自然语言分析方法分析出新闻预警级别,然后再计算出用户当前的舆情健康指数,并向用户显示与舆情健康指数对应的应对策略。本发明方法能够对舆情信息进行自动分析、统计、聚类等操作,具有成本低、效率高、准确性高、安全性较高等优点。
-
公开(公告)号:CN103778200A
公开(公告)日:2014-05-07
申请号:CN201410010836.X
申请日:2014-01-09
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30684
Abstract: 本发明公开了一种报文信息源抽取方法及其系统,该方法通过匹配信息源抽取规则库的关键词提取报文中的信息源,并匹配信息源抽取规则库的规则判断信息源类型,该方法包括:报文解析步骤和信息源抽取步骤,报文解析步骤用于根据输入的文本,提取文本中的字符,并对字符进行断句处理为不同分句,信息源抽取步骤为根据信息源抽取规则库对分句进行关键词匹配,对分句抽取有用要素序列,并在有用要素序列上,提取信息源,并通过匹配信息源抽取规则库的规则判断信息源类型。
-
-
-
-
-
-
-
-
-