-
公开(公告)号:CN105373601A
公开(公告)日:2016-03-02
申请号:CN201510755911.X
申请日:2015-11-09
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/245 , G06F21/55
Abstract: 本发明提供一种基于关键字词频特征的多模式匹配方法,首先从已知的信息数据库中提取关键字并统计出现频率作为其词频信息,其次采用构造含有关键字词频信息的二叉树完成其中的模式串匹配,在字符匹配过程中若出现字符不相等,则与该不匹配字符所在节点的兄弟节点所含字符进行匹配。其利用信息来源的模式的关键字词频信息构造基于字典树的二叉树完成其中的模式串的匹配,并与AC算法进行了比较。传统的AC算法需要维护三张表,并且在模式匹配过程中会频繁访问这三张表;本发明的一种基于关键字词频特征的多模式匹配方法更多的利用了模式本身的词频信息,并不需要维护过多的信息,这就大大减少了系统的内存消耗。
-
公开(公告)号:CN105302851A
公开(公告)日:2016-02-03
申请号:CN201510572332.1
申请日:2015-09-10
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30194
Abstract: 本发明提供一种基于文件序列化的自动机远程分发和初始化方法,将位于内存的自动机序列化成本地文件,然后将序列化后的文件进行分发和快速部署,以替代原有的基于规则和特征的分发和部署方式。该方法包括步骤:S1.配置后端服务器,将特征和规则进行初始化生成自动机;S2.在所述后端服务器上将自动机序列化到本地,以文件形式存储;S3.配置分发网络和n台处理机,所述后端服务器将文件形式存在的自动机通过分发网络发送给所有需要进行匹配处理的处理机;S4.每台处理机都接收文件形式存在的自动机,并初始化到内存;S5.处理机根据新生成自动机进行特征的匹配和检测处理。
-
公开(公告)号:CN104951712A
公开(公告)日:2015-09-30
申请号:CN201410200586.6
申请日:2014-05-13
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供一种Xen虚拟化环境下的数据安全防护方法,包括:对虚拟机进行完整性检查,并对虚拟机的关键部分进行加密及签名;当启动虚拟机时,对虚拟机进行解密并验证签名操作;成功后,主机的通信接口上连接硬件加密卡,对于同一台所述主机上模拟出的n台虚拟机,每一台虚拟机上创建加密卡驱动程序;各台虚拟机通过自身的加密卡驱动程序在硬件层直接访问硬件加密卡,通过硬件加密卡,进行加密业务处理操作,得到加密业务处理结果;当虚拟机完成任务后,将虚拟机还原到经过签名的初始状态,并将加密业务处理结果转换为密文,在经过身份验证后,通过专用通道导出到实际物理环境中存储。全面提高Xen虚拟环境下虚拟机进行数据处理的安全性。
-
公开(公告)号:CN103916316A
公开(公告)日:2014-07-09
申请号:CN201410145478.3
申请日:2014-04-11
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了网络数据包线速捕获方法,具体包括以下步骤:步骤一、在Tilera众核平台下配置Mpipe规则;步骤二、创建n个收包线程,为各个线程绑定一个用于处理数据包的CPU核,n个收包线程并行运行;步骤三、在每个收包线程中,调用Mpipe接口接收网络数据包,当CPU核接收到数据包,把数据包转变为PCAP文件格式,根据数据包的序列号获取数据包保存在PCAP文件内存的首地址,根据首地址存取数据包;步骤四、在每个收包线程中,当CPU核接收到数据包,修改数据包的描述符,然后调用Mpipe接口转发数据包;步骤五、在每个收包线程中,判断是否完成处理(完成处理指不进行后续数据包的处理),均完成后,结束处理,否则,返回步骤三。本发明大大提高了数据包线速捕获的效率。
-
公开(公告)号:CN119991328A
公开(公告)日:2025-05-13
申请号:CN202510151780.8
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q50/00 , G06F18/20 , G06F18/22 , G06F18/2323 , G06F16/9535 , G06N5/025 , G06F123/02
Abstract: 本公开涉及复杂网络分析技术领域,具体涉及一种融合内容结构规则和时间规律的目标社区发现方法及装置,所述融合内容结构规则和时间规律的目标社区发现方法,包括:获取用户的发文信息以及发文次数;从所述发文信息中识别用户内容结构规则,并通过杰卡德相似系数计算用户间内容结构规则相似度;基于所述发文次数构建用户发文时间规律矩阵,并通过皮尔逊相关系数计算用户间时间规律相似度;建立基于用户间内容结构规则相似度以及用户间时间规律相似度的网络无向加权图;使用谱聚类方法对于网络无向加权图进行社区发现,得到社区划分结果。上述技术方案有助于发现社交平台中的隐藏社群和影响力网络,准确定位基于用户偏好的目标社区。
-
公开(公告)号:CN119988633A
公开(公告)日:2025-05-13
申请号:CN202510151779.5
申请日:2025-02-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06F40/16 , G06F40/186 , G06F40/295 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/0464 , G06N5/022
Abstract: 本公开涉及自然语言处理技术领域,具体涉及一种基于大模型和知识库的文本观点自动标注方法及装置,所述基于大模型和知识库的文本观点自动标注方法包括:识别知识库中存在的与原始文本的实体对应的知识库实体以及所述知识库实体的扩展实体,将扩展实体基于预定义实体关系插入到原始文本中进行知识补全,生成知识嵌入文本;提供给定话题实体集;创建提示模板,将所述知识嵌入文本以及给定话题实体集填充所述提示模板中,然后利用大语言模型进行生成式标注得到态度标签;基于所述给定话题实体,态度标签得到倾向标签;基于所述原始文本、倾向标签构建标注数据集。上述技术方案对于高质量标注数据集的标注工作提供了有力支持。
-
公开(公告)号:CN109508471B
公开(公告)日:2024-04-12
申请号:CN201811110142.8
申请日:2018-09-21
Applicant: 长安通信科技有限责任公司 , 国家计算机网络与信息安全管理中心
IPC: G06F30/18
Abstract: 本发明公开了一种运动轨迹补全方法,该方法包括:获取两个相邻轨迹点记录之间的至少两条路径;基于两个相邻轨迹点记录的运动时长利用假设检验从至少两条路径中筛选出补全运动轨迹,补全运动轨迹能够通过假设检验,假设检验的至少部分参数是利用路径对应的相关运动记录得到的。本发明还公开了一种运动轨迹补全装置、可读存储介质。通过上述方式,本发明能够补全运动轨迹缺失的部分。
-
公开(公告)号:CN116049483A
公开(公告)日:2023-05-02
申请号:CN202211427384.6
申请日:2022-11-15
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC: G06F16/735 , G06F16/75 , G06F16/783 , G06F16/33 , G06F16/335 , G06F40/289 , G06N3/0464 , G06N3/048
Abstract: 本发明涉及短视频用户标签构建技术领域,具体公开了一种基于多模态数据的用户标签构建方法及系统,包括:S100数据预处理,采集短视频平台用户的数据并对数据进行分类,数据种类包括视频信息、平台信息和文本内容信息;S200视频标签处理,对视频信息进行分析计算,并对依据视频内容输出视频标签;S300平台信息标签处理,依据平台标签信息对用户文本信息进行处理,并输出平台信息标签,等步骤;本发明采用视频风格分类算法对用户产生的视频进行截帧过滤、统计,输出用户视频内容偏好标签,该维度比较真实的体现了用户的喜好;本发明结合了用户视频、平台采集信息、文本内容等多源数据进行标签生成,使得生成的标签结果能够更好的刻画用户的特征。
-
公开(公告)号:CN113656448A
公开(公告)日:2021-11-16
申请号:CN202110910039.7
申请日:2021-08-09
Applicant: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司 , 北京百卓网络技术有限公司
IPC: G06F16/2457 , G06F16/23 , G06F16/22 , H04L29/06
Abstract: 本发明提供了一种报文处理方法、装置、设备及可读存储介质,所述方法包括:获取报文;将所述报文获取的时间作为所述报文的第一时间戳,并基于所述报文的内容计算所述报文的第一特征值;以所述第一特征值为索引,查找特征表中是否存在所述第一特征值,得到查找结果,所述特征表包括第二特征值和每个所述第二特征值所对应的第二时间戳;根据所述查找结果、所述特征表和所述第一时间戳判断所述报文是否为重复报文,得到判断结果,根据所述判断结果对所述报文进行对应的处理。本发明中时间戳标记可以实现微秒级的报文接收时间记录,同时时间差阈值也是微秒级单位,因此也就可以进行微秒级的报文时间间隔判定,进而实现精确的网络报文去重。
-
公开(公告)号:CN112115269A
公开(公告)日:2020-12-22
申请号:CN202011172739.2
申请日:2020-10-28
Applicant: 国家计算机网络与信息安全管理中心河南分中心
IPC: G06F16/35 , G06F16/33 , G06K9/62 , G06F16/951 , G06F40/284
Abstract: 本发明公开了一种基于爬虫的网页自动分类方法,涉及数据分析领域,具体包括:首先,针对待分类的网页,利用定制爬虫获取内容信息并分出关键词。然后,逐个选取各关键词,依次比对是否属于互联网关键词类别库,如果是,得到该网页所属的类别个数M;否则,将不属于任何类别库的关键词单独记录。当类别个数M值大于等于2时,基于贝叶斯多维分类模型,随机选取2个类别,迭代判定该网页属于哪个类别的概率最大,将单独记录的关键词写入该类别词库中。当M的值等于1,则直接获取该网页所属类别,将单独记录的关键词写入;反之M等于0,则该网页内容属于暂时无法识别的网页,将其放入未识别网页词库中。本发明可以有效地提升网页分类的准确率。
-
-
-
-
-
-
-
-
-