-
公开(公告)号:CN108664622A
公开(公告)日:2018-10-16
申请号:CN201810455198.0
申请日:2018-05-14
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于二级倒排表的树状音频特征索引库建立方法,所述音频特征索引库建立方法在数字集成电路芯片中进行以下步骤:步骤1:对音频数据库中的所有特征分段进行粗量化;步骤2:对步骤1中的粗量化残差进行二级粗量化;步骤3:对粗量化残差进行乘积矢量量化;步骤4:插入倒排表。
-
公开(公告)号:CN109741731A
公开(公告)日:2019-05-10
申请号:CN201910015434.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。
-
公开(公告)号:CN109741731B
公开(公告)日:2020-12-29
申请号:CN201910015434.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。
-
公开(公告)号:CN108429649B
公开(公告)日:2020-11-06
申请号:CN201810244277.7
申请日:2018-03-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L12/24
Abstract: 本发明公开了一种基于多次单类型采集结果的综合异常判断系统,涉及网络预警技术领域。所述系统包括:阈值生成单元和异常判断单元;所述阈值生成单元,在从被采集系统上获取到的采集数据的基础上,计算判断阈值;所述异常判断单元,在所述判断阈值和所述采集数据的基础上,判断被采集系统运行是正常还是异常。本发明所述系统对采集到的数据进行多种方式进行判断,从而在不接触被监测系统后台日志或硬件数据的情况下准确识别出被检测系统的运行状况,解决了因使用平均值计算抗干扰性太弱,固定阈值判断性能太差,阈值波动范围设置方案单一且低效的问题。
-
公开(公告)号:CN110912833A
公开(公告)日:2020-03-24
申请号:CN201911377730.2
申请日:2019-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
IPC: H04L12/803 , H04L12/801
Abstract: 本发明公开了一种智能化的链路转发方法,网络流控设备实时计算流量大小,在流量低峰期,无论从哪个端口进入的流量都会负载均衡到链路出口端;在流量高峰期,如果网络流控设备中计算的流量大小pps超过了设定阈值,自动改变调度算法为选择调度,网络流控设备对进来的每个请求报文进行分析,获取报文的源和目的IP值进行哈希计算与已加密的规则进行匹配;如果该报文的源和目的IP的哈希值匹配,则将这部分流量转发到可信链路出口;如果该报文的源和目的IP不在字典中或不能正确匹配,则将其转发到其他链路出口端。本发明能将可信任的流量智能化切换到空闲可信链路转发,以保证可信流量的可靠和稳定转发。
-
公开(公告)号:CN108667708A
公开(公告)日:2018-10-16
申请号:CN201810353208.X
申请日:2018-04-19
Applicant: 国家计算机网络与信息安全管理中心 , 南京中新赛克科技有限责任公司
IPC: H04L12/46 , H04L12/851
CPC classification number: H04L12/4641 , H04L12/4658 , H04L47/24 , H04L47/2441 , H04L47/2483
Abstract: 本发明公开一种多种VPN流量的采集分析系统及采集分析方法,以解决VPN流量类型变多、量级呈快速增长态势,对不同VPN流量如何筛选的问题。本发明中引入VPN用户概念,每台设备可有多个VPN用户,每个用户可一对多映射多个MPLS、VlAN、Frame relay,既能有效屏蔽VPN差异性,相比多对多映射,又能有效降低空间复杂度,使用六元组规则(VPN用户、源IP、目的IP、源端口、目的端口、协议类型),能够同时匹配VPN和五元组字段,可精准标识出目标VPN流量,显著提高流量采集分析的准确率。
-
公开(公告)号:CN108563686A
公开(公告)日:2018-09-21
申请号:CN201810208801.5
申请日:2018-03-14
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及计算机技术领域,具体提供了一种基于混合神经网络的社交网络谣言识别方法及系统,旨在解决如何在考虑谣言转发评论信息的情况下,准确识别社交网络中谣言的技术问题。为此目的,本发明中社交网络谣言识别方法,首先利用三种不同的神经网络分别获取用户特征向量、原文特征向量和传播信息特征向量,然后将用户特征向量、原文特征向量和传播信息特征向量融合为新的特征向量,最后利用第四种神经网络对融合后的特征向量进行谣言识别。基于上述步骤,能够快速且准确地检测到社交网络中的谣言。同时,本发明中的系统能够执行并实现上述步骤。
-
公开(公告)号:CN108429649A
公开(公告)日:2018-08-21
申请号:CN201810244277.7
申请日:2018-03-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04L12/24
CPC classification number: H04L41/0631 , H04L41/064
Abstract: 本发明公开了一种基于多次单类型采集结果的综合异常判断系统,涉及网络预警技术领域。所述系统包括:阈值生成单元和异常判断单元;所述阈值生成单元,在从被采集系统上获取到的采集数据的基础上,计算判断阈值;所述异常判断单元,在所述判断阈值和所述采集数据的基础上,判断被采集系统运行是正常还是异常。本发明所述系统对采集到的数据进行多种方式进行判断,从而在不接触被监测系统后台日志或硬件数据的情况下准确识别出被检测系统的运行状况,解决了因使用平均值计算抗干扰性太弱,固定阈值判断性能太差,阈值波动范围设置方案单一且低效的问题。
-
公开(公告)号:CN108305616A
公开(公告)日:2018-07-20
申请号:CN201810039421.3
申请日:2018-01-16
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明涉及一种基于长短时特征提取的音频场景识别方法及装置,该方法包括,对输入待识别音频信号进行预处理;对经过预处理后的所述待识别音频信号,进行短时音频特征提取,再进行长时音频特征提取,将所述待识别音频信号的所述长、短时音频特征联合,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签。本发明在常规短时特征提取的基础之上,进一步联合音频场景长时特征,可以表征复杂的音频场景信息,输入分类模型及其融合模型,进行分类和识别,输出音频场景的识别标签,其鲁棒性更强、区分性更好,且能够在更大程度上表征场景数据的整体特性,识别效率高、稳定性强。
-
公开(公告)号:CN105373601A
公开(公告)日:2016-03-02
申请号:CN201510755911.X
申请日:2015-11-09
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/245 , G06F21/55
Abstract: 本发明提供一种基于关键字词频特征的多模式匹配方法,首先从已知的信息数据库中提取关键字并统计出现频率作为其词频信息,其次采用构造含有关键字词频信息的二叉树完成其中的模式串匹配,在字符匹配过程中若出现字符不相等,则与该不匹配字符所在节点的兄弟节点所含字符进行匹配。其利用信息来源的模式的关键字词频信息构造基于字典树的二叉树完成其中的模式串的匹配,并与AC算法进行了比较。传统的AC算法需要维护三张表,并且在模式匹配过程中会频繁访问这三张表;本发明的一种基于关键字词频特征的多模式匹配方法更多的利用了模式本身的词频信息,并不需要维护过多的信息,这就大大减少了系统的内存消耗。
-
-
-
-
-
-
-
-
-