-
公开(公告)号:CN116611433A
公开(公告)日:2023-08-18
申请号:CN202310478295.2
申请日:2023-04-28
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/289 , G06Q10/0639 , G06F18/24 , G06N3/0464 , G06N20/00
摘要: 本发明实施例涉及一种情感识别方法及系统,所述方法包括:获取目标文本对应的初始数据,所述初始数据是由所述目标文本经过预处理得到的;设定所述初始数据的细粒度规则,得到所述初始数据对应不同长度的类别文本;根据所述细粒度规则和所述类别文本,确定不同长度的所述类别文本对应的不同类别的情感识别模型;将所述类别文本输入到对应的所述情感识别模型中进行识别处理,得到所述目标文本的情感识别结果。通过对获得到初始数据按照设定的细粒度规则进行设定分类,确定情感识别模型,通过识别处理得到情感识别结果,由此,可以更加准确地表达和识别用户的情感倾向和理解用户情感,更好地支持情感分析应用,更好地支持舆情分析,实现对短文本的情感识别处理的技术效果。
-
公开(公告)号:CN115269834A
公开(公告)日:2022-11-01
申请号:CN202210782688.8
申请日:2022-06-28
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
摘要: 本发明公开了一种基于BERT的高精度文本分类方法及装置,在输入端采用FastText模型,对词汇进行嵌入表示得到表示向量,然后把表示向量作为BERT模型的输入,将BERT的输出结果接上全连接层+softmax,实现文本分类。本发明提前用FastText模型处理语料数据,获取字符的特征,解决了OOV的embedding问题,同时获取词的形态变换,对富有词型变换的语料具有更好的表示能力;使用BERT能够提前预训练大量的语料,增加了词向量的语义丰富度,获得更好的上下文表示;在BERT模型的输出添加全连接层和softmax进行文本分类,提高了文本分类的精度。
-
公开(公告)号:CN115190217A
公开(公告)日:2022-10-14
申请号:CN202210801788.0
申请日:2022-07-07
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明公开了一种融合自编码网络的数据安全加密方法和装置,涉及互联网数据处理技术领域。本发明为了解决现有数据安全加密时面对包含大量图片的海量数据存储资源开销大、数据传输不安全、数据传输效率低的缺陷,其方法为采用文本加密模块对文本类型数据作加密处理,构建图片自编码网络模型,采用图片压缩模块对待加密的原始图片类型数据作预压缩处理;采用图片加密模块对图片压缩编码作加密处理,采用解密模块对需要应用于下游任务的文本密文数据或图片密文数据进行解密,采用图片重建模块对解密后的图片压缩编码进行重建复原,译码器将码字通过重建处理后得到重建图片类型数据。本发明主要用于海量数据传输。
-
公开(公告)号:CN114978585A
公开(公告)日:2022-08-30
申请号:CN202210380490.7
申请日:2022-04-12
申请人: 国家计算机网络与信息安全管理中心 , 北京赋乐科技有限公司
摘要: 本公开的实施例提供了基于流量特征的深度学习对称加密协议识别方法、装置、设备和计算机可读存储介质。所述方法包括获取网络流量数据;对所述网络流量数据进行预处理,得到对称加密流量;基于主成分分析‑皮尔森系数法流量识别模型和基于注意力机制的CNN‑LSTM算法流量识别模型,构建基于流量特征的对称加密协议识别模型;将所述对称加密流量,输入至所述基于流量特征的对称加密协议识别模型,完成对所述网络流量数据的识别。以此方式,实现了对对称加密协议的高效识别。
-
公开(公告)号:CN111159990A
公开(公告)日:2020-05-15
申请号:CN201911244936.8
申请日:2019-12-06
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC分类号: G06F40/186 , G06F40/126 , G06F40/284 , G06F16/33 , G06F16/31
摘要: 本发明提出一种基于模式拓展的通用特殊词识别方法及系统,提出了一种基于基础词的音形编码,常用汉字音节,常用汉字结构以及特殊字符映射节点来构建前缀树,通过比较字符编码相似度进行模糊匹配,完成新词提取的方法及系统。本发明可以应用于大量文本中特定词的发现提取,某些任务的数据集的提取生成,给定文本数据集的预处理等场景中,比如短信、微博等数据集的筛选以及纠正等文本预处理过程。本发明为下一步的文本分类任务提供了数据来源和基本标注,也对文本数据中新词的发现和纠正提供了帮助。
-
公开(公告)号:CN111078876A
公开(公告)日:2020-04-28
申请号:CN201911229492.0
申请日:2019-12-04
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC分类号: G06F16/35
摘要: 本发明提出了一种基于多模型集成的短文本分类方法,包括:选取多个对短文本进行分类的分类模型;对训练样本进行采样,生成与该分类模型一一对应的训练集;通过对应的训练集对该分类模型进行训练,以获得对应的最终模型;通过所有该最终模型对目标文本进行分类,获取多个分类结果向量;集成所有该分类结果向量以得到最终结果向量,以该最终结果向量中具有最大值的元素所代表的类别,作为该目标文本的类别。
-
公开(公告)号:CN106209833A
公开(公告)日:2016-12-07
申请号:CN201610538299.5
申请日:2016-07-08
申请人: 汉柏科技有限公司 , 国家计算机网络与信息安全管理中心
CPC分类号: H04L63/1466 , H04L67/02
摘要: 本发明公开一种防止网页劫持的方法及网关,涉及网络技术领域,所述方法包括:获取用户终端发送的超文本传输协议HTTP报文;判断所述HTTP报文是否为获取GET请求报文;若是,则对所述GET请求报文进行分段,得到至少两个分段报文;将各分段报文发送到运营商设备,以防止所述GET请求报文请求的网页在所述运营商设备被劫持。相比于现有技术,本发明提出的防止网页劫持的方法及网关,通过将用户终端发送的HTTP的GET请求报文进行分段,使劫持服务器无法识别GET请求报文,从而防止网页被劫持,提高了用户浏览网页的安全性。
-
公开(公告)号:CN105160251A
公开(公告)日:2015-12-16
申请号:CN201510390821.5
申请日:2015-07-06
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F21/56
CPC分类号: G06F21/563 , G06F2221/033
摘要: 本发明公开了一种APK应用软件行为的分析方法及装置,其中,该方法包括:接收用户上传的APK文件及体验数据,其中,体验数据为用户在APK文件对应的应用软件下的基础用户信息;使用体验数据在沙盒中动态运行对APK文件,并记录运行过程中APK文件的动态行为,以构建动态行为集;对APK文件进行静态分析,以构建静态行为集;根据动态行为集和静态行为集对APK文件进行综合分析,以确认APK文件的安全性能。通过运用本发明,解决了现有技术中的软件安全管理,都是在软件运行过程中进行监测,一旦发现问题对其进行记录及阻止,由于现有应用软件的复杂多样,目前的监测方式无法完全阻止非法应用软件窃取用户隐私及乱扣费等操作,用户体验较低的问题。
-
公开(公告)号:CN118520929A
公开(公告)日:2024-08-20
申请号:CN202411003497.2
申请日:2024-07-25
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06N3/09 , G06N3/0455 , G06F40/194
摘要: 本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
-
公开(公告)号:CN118277914A
公开(公告)日:2024-07-02
申请号:CN202311471891.4
申请日:2023-11-07
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F18/2431 , G06F18/24 , G06F18/213 , G06F18/22
摘要: 本发明涉及APP分类分析技术领域,公开了一种基于动静结合多维度APK特征的移动应用分类方法,首先进行APP特征构建,基于主流手机应用商店、互联网小型分发平台、APP传播页面对APP的信息进行采集,具体通过APP所提供的功能或呈现的信息内容,识别APP的业务分类,采集通信类的信息,形成初始的测试数据集;再基于APP源码进行分析,获取APP的静态源码特征、动态流量和页面特征数据,具体包括名称、流量和内容信息;进行建立规则匹配模型和匹配机制,具体通过构建定时扫描程序,通过预设的各分类规则匹配模型进行识别和研判。本发明对具有显著技术特征或内容特征的APP具有较高的识别准确率,降低人工审核参与度。
-
-
-
-
-
-
-
-
-