-
公开(公告)号:CN117609497A
公开(公告)日:2024-02-27
申请号:CN202311343043.5
申请日:2023-10-17
申请人: 国家计算机网络与信息安全管理中心 , 中网数安(北京)科技有限公司 , 联洋国融(北京)科技有限公司
IPC分类号: G06F16/35 , G06F18/214 , G06F18/22 , G06F18/2431
摘要: 本发明提供一种文本有害内容无监督识别方法及装置。所述方法包括:获取待识别的多个文本,计算每个待识别文本的特征向量;计算有害文本分类库中每个有害文本类别的特征向量,有害文本分类库包括每种有害文本类别的标识词;计算待识别文本的特征向量与每个有害文本类别的特征向量的相似度,若所述相似度的最大值超过设定阈值,则所述最大值对应的有害文本类别为所述待识别文本的类别。本发明通过构建有害文本分类库,并通过相似度计算,能够对文本中的有害内容进行无监督识别,解决了基于有监督学习的现有识别方法存在的需要不断地对新的大量文本数据进行标注,耗费大量的人工和时间的问题。
-
公开(公告)号:CN118734928A
公开(公告)日:2024-10-01
申请号:CN202410629625.8
申请日:2024-05-21
申请人: 国家计算机网络与信息安全管理中心
摘要: 本公开涉及一种微调指令的构造方法、装置、设备及介质,该方法包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本公开针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。
-
公开(公告)号:CN117290493A
公开(公告)日:2023-12-26
申请号:CN202311295408.1
申请日:2023-10-08
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/335 , G06F16/338 , G06F16/35
摘要: 本公开涉及一种舆情风险监测方法、装置、设备及介质。其中,舆情风险监测方法包括:获取目标舆情数据,并对目标舆情数据进行数据预处理,得到第一舆情数据;对第一舆情数据进行数据分析处理,得到第二舆情数据;对第二舆情数据进行风险舆情识别处理,得到对应的风险舆情识别数据;根据风险舆情识别数据进行分类统计处理,得到不同预设时间窗口的风险舆情结果。根据本公开实施例,能够更加准确的对企业风险舆情进行监测,改善了依赖人工统计分析、费时费力的现状,使后续研判更具准确性、有效性、科学性。
-
公开(公告)号:CN114819963A
公开(公告)日:2022-07-29
申请号:CN202110071008.7
申请日:2021-01-19
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明实施例提供了一种风险预警方法、装置、电子设备及存储介质,所述方法包括:获取待分析的数字货币交易平台的平台数据;对平台数据进行数字货币平台风险指标量化处理,生成数字货币交易平台对应的风险指标向量;将风险指标向量输入至预设的数字货币交易平台风险预警模型,输出数字货币交易平台对应的风险指数;基于风险指数对数字货币交易平台风险进行预警。如此可实现自动对数字货币交易平台风险进行预警的目的,无需人工参与,减少时间和精力的浪费,使得数字货币交易平台风险发现简单,且提高了数字货币交易平台风险发现和处置的准确率和时效性。
-
公开(公告)号:CN118365450A
公开(公告)日:2024-07-19
申请号:CN202410454918.7
申请日:2024-04-16
申请人: 北京理工大学 , 国家计算机网络与信息安全管理中心
IPC分类号: G06Q40/04 , G06F18/243 , G06F18/214 , G06F18/21 , H04L47/2483 , G06Q20/06 , G06Q20/22 , G06Q20/38
摘要: 本发明涉及一种基于流量群体特征的数字货币跨区域交易识别方法,属于区块链及数字货币监管技术领域。本方法通过分析交易涉及的跨域流量,分析流量数据包的统计特征,利用有监督学习实现交易发起账户域内(外)归属的分类,实现跨域交易的识别筛选。本发明只需要部署在网关处,减小网络管理员实施所需成本,同时仅需被动监听流量,不会对网络正常工作产生干扰。本方法通过模拟现实世界的真实数据集,充分验证了有效性。
-
公开(公告)号:CN112182020A
公开(公告)日:2021-01-05
申请号:CN202011184465.9
申请日:2020-10-29
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/242 , G06F40/289 , G06Q30/06 , G06Q30/08 , G06Q40/02 , G06Q40/04 , G06Q40/06 , G06N3/04
摘要: 本申请涉及一种金融行为识别与分类的方法、装置及计算机可读存储介质。其中,方法包括:从至少两个数据源获取多源数据文本,然后按照预先设定的数据处理方式对数据文本进行预处理,得到各数据文本的向量,将各所述数据文本的向量输入到预先训练的多尺度卷积神经网络模型中,根据数据源的类型确定各所述数据文本的向量的卷积核,再利用各自的卷积核提取各向量的语义特征,从而根据各向量的语义特征确定各预设金融行为的概率,最后再根据各预设金融行为的概率确定多源数据文本对应的金融行为。多数据源能够体现出目标金融机构各个方面的实际开展的业务,从而能够更为准确地识别出目标金融机构实际的金融行为,更加便于监管。
-
公开(公告)号:CN112149413A
公开(公告)日:2020-12-29
申请号:CN202010932371.9
申请日:2020-09-07
申请人: 国家计算机网络与信息安全管理中心 , 深圳市任子行科技开发有限公司
IPC分类号: G06F40/284 , G06F40/289 , G06F40/30 , G06F40/216 , G06N3/04 , G06N3/08
摘要: 本发明提供一种基于神经网络识别互联网网站所属业态的方法、装置以及计算机可读存储介质。该方法包括:获取互联网网站业态的文本数据集,从所述文本数据集中提取文本特征词;基于所述文本特征词对所述文本特征词进行词向量化以获取词向量序列;将所述词向量序列分别输入递归神经网络及卷积神经网络模型,分别得到所述递归神经网络及卷积神经网络模型输出的目标特征向量,并将所述目标特征向量进行并联拼接;将已拼接的所述目标特征向量输入全连接神经网络,最后输出概率预测向量;查找所述概率预测向量中的最大值,并以所述最大值对应的业态作为所述互联网网站的所属业态。通过本发明,实现了高精度识别互联网网站的所属业态。
-
公开(公告)号:CN118656490A
公开(公告)日:2024-09-17
申请号:CN202410629623.9
申请日:2024-05-21
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06F40/30 , G06N3/0455 , G06N5/04
摘要: 本发明涉及一种文本分类方法、装置、设备和存储介质,文本分类方法包括:获取待处理文本,待处理文本包含对于目标事件的目标观点;将大模型运用到特定文本分类任务上,在该分类任务的目标立场下对待处理文本进行分类处理,确定目标事件的事件类别,且大模型还是基于少数据量的数据集上训练的,准确率也很高,同时在分类任务的基础上,提出了多任务间的自我校验的可解释优化任务,确定反应目标观点情感倾向的可解释的倾向信息;使用二分类模型对可解释的倾向信息进行语义分析,审核大模型的分类准确性,确定反应目标观点情感倾向的倾向类别;根据倾向类别和事件类别,确定待处理文本的目标类别,有效提高了文本分类的准确性。
-
公开(公告)号:CN117278257A
公开(公告)日:2023-12-22
申请号:CN202311104842.7
申请日:2023-08-30
申请人: 国家计算机网络与信息安全管理中心 , 长安通信科技有限责任公司
IPC分类号: H04L9/40
摘要: 本发明提供一种加密挖矿代理软件服务端资源监测方法及装置。所述方法包括:定时运行挖矿软件和加密挖矿代理软件;基于加密挖矿代理软件运行进程ID,监测加密挖矿代理软件的网络流量,并生成流量数据包数据库;基于先验知识库进行加密挖矿代理软件服务端IP、端口和域名识别;基于识别出的加密挖矿代理软件服务端的信息进行防火墙策略配置;基于先验知识库的挖矿币种识别,更新服务端信息库和币种挖矿流量特征库。本发明通过对加密挖矿代理软件的自动运行、采集数据、分析,减少了人工操作环节,能够达到自动运行长期监测的目标,解决了加密挖矿代理软件不定时更改服务端信息问题。
-
公开(公告)号:CN116346483A
公开(公告)日:2023-06-27
申请号:CN202310351861.3
申请日:2023-04-04
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04L9/40 , G06F18/243 , G06F18/214
摘要: 本发明提供一种加密挖矿行为识别方法及装置。所述方法包括以下步骤:基于矿工与矿池通信的反馈报文获取包括IP信息和端口信息的加密矿池节点信息;根据获取的加密矿池节点信息,进行加密挖矿流量特征提取;构建机器学习模型分类器,将提取的流量特征输入到所述分类器,对加密挖矿行为进行识别。本发明通过获取加密矿池节点信息、提取加密挖矿流量和构建机器学习模型分类器,能够精确识别加密挖矿行为。
-
-
-
-
-
-
-
-
-