-
公开(公告)号:CN114116172A
公开(公告)日:2022-03-01
申请号:CN202111454126.2
申请日:2021-12-01
Applicant: 恒安嘉新(北京)科技股份公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种流量数据采集方法、装置、设备及存储介质,包括:接收多个数据采集策略,根据各数据采集策略对应的通信层,将各数据采集策略分别传输至对应的层级处理模块;所述数据采集策略根据业务需求预先设定;通过各层级处理模块执行多个数据采集策略,并实时对DPI系统运行过程中占用的资源进行监控,得到资源占用结果;如果资源占用结果超过预设阈值,则通过各层级处理模块根据各数据采集策略对应的优先级,在多个数据采集策略中依次确定待执行的目标采集策略,并依次执行目标采集策略。本发明实施例的技术方案可以实现移动互联网中的流量数据按需采集,满足业务需求和资源占用之间的平衡。
-
公开(公告)号:CN114116172B
公开(公告)日:2024-12-31
申请号:CN202111454126.2
申请日:2021-12-01
Applicant: 恒安嘉新(北京)科技股份公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种流量数据采集方法、装置、设备及存储介质,包括:接收多个数据采集策略,根据各数据采集策略对应的通信层,将各数据采集策略分别传输至对应的层级处理模块;所述数据采集策略根据业务需求预先设定;通过各层级处理模块执行多个数据采集策略,并实时对DPI系统运行过程中占用的资源进行监控,得到资源占用结果;如果资源占用结果超过预设阈值,则通过各层级处理模块根据各数据采集策略对应的优先级,在多个数据采集策略中依次确定待执行的目标采集策略,并依次执行目标采集策略。本发明实施例的技术方案可以实现移动互联网中的流量数据按需采集,满足业务需求和资源占用之间的平衡。
-
公开(公告)号:CN112287684B
公开(公告)日:2024-06-11
申请号:CN202011192254.X
申请日:2020-10-30
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/30
Abstract: 本发明属于领域,具体涉及了一种融合变体词识别的短文本审核方法及装置,旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括:构建配置词库,基于社交媒体平台获取待审核文本数据,对待审核文本数据进行筛选获得可疑文本数据,并去除无意义信息并计算文本特征向量和统计特征向量,将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本,利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新,提高了文本审核的准确率和更新速度。
-
公开(公告)号:CN116367181A
公开(公告)日:2023-06-30
申请号:CN202211679996.4
申请日:2022-12-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W16/22 , H04W16/18 , H04B17/318 , H04B17/336 , H04B17/382 , G06N7/01
Abstract: 本发明公开了一种空地融合蜂窝网络中的无人机基站部署方法,包括如下步骤:S1:在地面基站侧和网络侧分别进行信息采集;S2:基于步骤S1中的信息建立系统模型,系统模型包括地面基站参数模型、无人机基站传播模型和无人机基站天线阵列模型;S3:基于地面基站用户的平均传输速率和无人机基站用户的平均传输速率,建立性能评估模型;S4:根据步骤S3的性能评估模型,设置多组网络参数组合进行关键性能指标的数值计算,并根据计算结果选择使关键性能指标达到最大的参数组合,作为最终的参数配置;S5:确定无人机基站的水平位置部署。本发明充分考虑了无人机之间的空间保护距离,尤其适用于无人机基站采用多天线配置的场景。
-
公开(公告)号:CN115982111A
公开(公告)日:2023-04-18
申请号:CN202211660716.5
申请日:2022-12-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/17 , G06F16/18 , H04L61/4511 , H04L101/69 , H04L101/668
Abstract: 本发明公开了一种基于IP访问特征的用户群体画像方法,涉及网络治理技术领域,该方法首先根据日志的访问域名的类别信息,通过数理统计的方法构建IP访问特征数据集,然后,基于用户群体划分算法识别特定群体和非特定群体,最后,构建用户群体属性标签体系,对划分的群体进行群体画像分析,在充分研究原始日志的基础上,以IP访问特征为着力点,设计了基于规则和机器学习相结合的用户群体划分算法,根据日志数据量大的特点,研究了在大数据情况下,优化机器学习算法效率的方法。
-
公开(公告)号:CN112287684A
公开(公告)日:2021-01-29
申请号:CN202011192254.X
申请日:2020-10-30
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/30
Abstract: 本发明属于领域,具体涉及了一种融合变体词识别的短文本审核方法及装置,旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括:构建配置词库,基于社交媒体平台获取待审核文本数据,对待审核文本数据进行筛选获得可疑文本数据,并去除无意义信息并计算文本特征向量和统计特征向量,将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本,利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新,提高了文本审核的准确率和更新速度。
-
公开(公告)号:CN110061975A
公开(公告)日:2019-07-26
申请号:CN201910249260.5
申请日:2019-03-29
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L29/06
Abstract: 本发明涉及一种基于离线流量包解析的仿冒网站识别方法,包括:根据已知网站信息库训练随机森林分类器,以构建对仿冒网站的判别模型;获取待检测网站的数据流并保存为离线流量包,通过该离线流量包得到该待检测网站的网站信息;根据该已知网站信息库对该网站信息进行规则匹配,对匹配为仿冒网站的待检测网站进行标识,将匹配失败的网站信息通过该判别模型进行判别,并对判别为仿冒网站的待检测网站进行标识。
-
公开(公告)号:CN118821782A
公开(公告)日:2024-10-22
申请号:CN202410768553.5
申请日:2024-06-14
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种多粒度相似性增强的篇章级事件论元抽取方法及系统,属于文本信息抽取领域。本发明首先将文档输入预训练语言模型编码,得到高维度嵌入表示;然后构建包含句子和段落节点的异构图,通过图神经网络融合全局语义信息;最后,通过对比学习和排序损失增强段落和句子粒度的相似性。本发明解决了远距离事件论元抽取的难题,并有效缓解了噪音实体对抽取结果的干扰,提高了抽取的准确性和鲁棒性。
-
公开(公告)号:CN116702094B
公开(公告)日:2023-12-22
申请号:CN202310957274.9
申请日:2023-08-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/26 , G06F18/25 , G06F18/213 , G06F18/22 , G06F18/27 , G06N3/045 , G06N3/044 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及数据处理技术领域,提供一种群体应用偏好特征表示方法,其中方法包括:获取用户的交互数据;基于多模态预训练模型,提取所述交互数据的特征表示;基于所述交互数据的特征表示,确定所述交互数据的群体应用偏好特征;基于所述群体应用偏好特征,对所述用户进行画像。本发明提供的群体应用偏好特征表示方法,能够自适应的针对任意的纯文本数据、纯图像数据、图文混合数据提取联合特征,实现对多模态数据的分析处理,在图文模态下,可以增加特征提取的语义交互能力,使得到的群体应用偏好特征更准确,从而提高用户画像的质量。
-
公开(公告)号:CN110134947B
公开(公告)日:2021-03-26
申请号:CN201910307654.1
申请日:2019-04-17
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
-
-
-
-
-
-
-
-
-