-
公开(公告)号:CN109741731A
公开(公告)日:2019-05-10
申请号:CN201910015434.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。
-
公开(公告)号:CN115941192A
公开(公告)日:2023-04-07
申请号:CN202211193796.8
申请日:2022-09-28
Applicant: 清华大学 , 国家计算机网络与信息安全管理中心
IPC: H04L9/32 , H04L9/40 , H04L61/5007 , H04L101/659
Abstract: 本发明提供一种IPv6地址前缀编码方法、装置、存储介质及电子设备,一种IPv6地址前缀编码方法,包括:获取路由前缀;计算包含当前实体的实体标识,以及时间戳或随机数的密文;基于所述密文和用于辅助标识实体类型的辅助标志位生成子前缀;基于所述路由前缀和子前缀生成当前实体的IPv6地址的前缀。实现了5G网络下针对特定实体的IPv6地址中嵌入实体标识,在IPv6地址前缀编码、分配或实体标识提取时,实现5G网络责任实体与IPv6地址的关联,同时避免对现有5G网络架构及核心网的网元进行大规模修改,解决了5G网络下责任实体与IPv6地址的关联和识别问题。
-
公开(公告)号:CN108664622A
公开(公告)日:2018-10-16
申请号:CN201810455198.0
申请日:2018-05-14
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于二级倒排表的树状音频特征索引库建立方法,所述音频特征索引库建立方法在数字集成电路芯片中进行以下步骤:步骤1:对音频数据库中的所有特征分段进行粗量化;步骤2:对步骤1中的粗量化残差进行二级粗量化;步骤3:对粗量化残差进行乘积矢量量化;步骤4:插入倒排表。
-
公开(公告)号:CN109741731B
公开(公告)日:2020-12-29
申请号:CN201910015434.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。
-
公开(公告)号:CN112105056B
公开(公告)日:2022-12-20
申请号:CN202010768504.3
申请日:2020-08-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京百卓网络技术有限公司
IPC: H04W28/06 , H04W28/10 , H04W88/16 , H04L67/1095
Abstract: 本发明公开了一种基于5GSA网络的码流传输方法和系统,该方法包括:基于大区中心采集控制面原始码流;回传原始码流;采集数据面原始码流;从所述各个省公司传输所述控制面原始码流和所述数据面原始码流至所述各个省公司下属的相关系统。核心网NVF集中化后,核心网网元均以虚拟机方式部署在云平台上,本发明采用TOR镜像结合分光采集的方式解决传统3/4G基于物理端口分光方式不适用的问题,还采取对大区原始码流进行分发回传给省公司方式,解决了5G控制面数据采取大区制集中部署,控制面数据不在本地机房问题,最后,采用SDTP协议针对原始码流进行封装,根据省份标识将不同省份的原始码流通过IP网络回传至省公司,保证了数据流能够在网络中安全稳定传输。
-
公开(公告)号:CN112131356B
公开(公告)日:2022-06-07
申请号:CN202010768507.7
申请日:2020-08-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京百卓网络技术有限公司
IPC: G06F16/332 , G06F16/31
Abstract: 本发明公开了一种基于TCAM的报文关键字匹配方法和装置,该方法包括:基于关键字规则数据库和TCAM芯片生成规则索引数据库和规则全文数据库;将第一查询命令字符在所述规则索引数据库中进行匹配;若命中与所述第一查询命令字符相关的索引规则,将第二查询命令字符在所述规则全文数据库中进行匹配;若命中与所述第二查询命令字符相关的规则全文,则基于获取命中的所述规则全文,处理待处理的报文。本发明基于硬件TCAM芯片的匹配速度快但是容量有限的特点,将关键字规则分为长度较短的规则索引和较长的规则全文进行分阶段匹配,兼顾了TCAM芯片的利用率和匹配性能,同时方案无需更改或增加硬件设备,复杂度低,具有较强的实用性。
-
公开(公告)号:CN108650194B
公开(公告)日:2022-03-25
申请号:CN201810454425.8
申请日:2018-05-14
Applicant: 南开大学 , 国家计算机网络与信息安全管理中心
IPC: H04L47/2441 , H04L47/2483 , G06K9/62
Abstract: 本发明提出了基于K_means和KNN融合算法的网络流量分类方法。该方法的框架是针对每个应用协议构建一个二分类器,由决策规则将所有分类器的输出整合为最终输出。算法上融合了无监督的K_means算法和有监督的KNN算法,此外,该方法还提出了基于K_means迭代的特征选择算法,目的是选出高分离度的特征,以节省时间、空间和提高分类效果。实验结果表明,在真实流量数据上,本发明对流量识别的准确率和召回率可达90%以上,相比现有典型的流量分类方法效果更好;本发明还可识别出未登录流量,与典型的分类方法相比在功能上有了扩展。
-
公开(公告)号:CN107305767B
公开(公告)日:2020-03-17
申请号:CN201610236672.1
申请日:2016-04-15
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
IPC: G10L15/00 , G10L15/04 , G10L15/10 , G06F40/263
Abstract: 本发明提供了一种应用于语种识别的短时语音时长扩展方法,所述方法包括:对于一条时长较短的待识别语音,首先根据其语音时长确定生成的不同语速语音的数量n;然后根据合成帧移值及n个语速变化率计算生成语音的n个分解帧移;根据分解帧移和合成帧移生成n个不同语速的语音,将n个不同语速的语音与原语音拼接起来,生成一个时长加长的语音。不同语速的语音的语种信息具有互补性,本发明所提出的方法可以显著提升短时语音的语种识别性能。
-
公开(公告)号:CN105631050B
公开(公告)日:2019-09-17
申请号:CN201610111430.X
申请日:2016-03-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/955
Abstract: 本发明公开了一种基于规则配置的URL搜索关键词提取的方法,包括生成规则:对需要支持的搜索引擎的搜索URL进行分析,提取搜索URL特征并生成规则;配置规则:配置上述步骤分析到的规则;URL过滤:接收第三方的URL数据并与配置的所述规则进行匹配来过滤收到的所有URL数据;关键词处理:当有第三方的URL命中所述规则,则提取该URL的搜索关键词。本发明可以通过配置规则来快速的实现对多种搜索引擎的搜索URL关键字进行提取,实现海量URL数据的快速处理,从而在信安系统或舆情系统中使用本发明可以提供强有力的支撑。
-
公开(公告)号:CN106102090B
公开(公告)日:2019-07-05
申请号:CN201610421149.6
申请日:2016-06-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W24/04
Abstract: 本发明公开了一种LTE多接口数据回填方法,其特征在于,所述方法包括:采集S1‑MME或者S10接口消息,获取IMSI参数;采集所述S1‑MME接口消息中的至少一个全球唯一临时UE标识GUTI,并与所述IMSI参数建立UTI~IMSI映射表;获取所述S1‑MME接口消息中的会话参数,根据所述会话参数和所述GUTI~IMSI映射表关联所述S1‑MME接口与S6a接口;以及所述LTE中的至少一个接口根据共有关键参数与所述S1‑MME接口关联,回填数据。本发明公开的技术方案能够提高移动用户上网日志查询和网络安全事件追溯的准确性,而且可以提高身份信息的回填率和准确率,提高数据回填的效率。
-
-
-
-
-
-
-
-
-