-
公开(公告)号:CN112287684B
公开(公告)日:2024-06-11
申请号:CN202011192254.X
申请日:2020-10-30
申请人: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/295 , G06F40/30
摘要: 本发明属于领域,具体涉及了一种融合变体词识别的短文本审核方法及装置,旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括:构建配置词库,基于社交媒体平台获取待审核文本数据,对待审核文本数据进行筛选获得可疑文本数据,并去除无意义信息并计算文本特征向量和统计特征向量,将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本,利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新,提高了文本审核的准确率和更新速度。
-
公开(公告)号:CN112287684A
公开(公告)日:2021-01-29
申请号:CN202011192254.X
申请日:2020-10-30
申请人: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/295 , G06F40/30
摘要: 本发明属于领域,具体涉及了一种融合变体词识别的短文本审核方法及装置,旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括:构建配置词库,基于社交媒体平台获取待审核文本数据,对待审核文本数据进行筛选获得可疑文本数据,并去除无意义信息并计算文本特征向量和统计特征向量,将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本,利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新,提高了文本审核的准确率和更新速度。
-
公开(公告)号:CN116702094A
公开(公告)日:2023-09-05
申请号:CN202310957274.9
申请日:2023-08-01
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F18/26 , G06F18/25 , G06F18/213 , G06F18/22 , G06F18/27 , G06N3/045 , G06N3/044 , G06N3/0442 , G06N3/0464 , G06N3/08
摘要: 本发明涉及数据处理技术领域,提供一种群体应用偏好特征表示方法,其中方法包括:获取用户的交互数据;基于多模态预训练模型,提取所述交互数据的特征表示;基于所述交互数据的特征表示,确定所述交互数据的群体应用偏好特征;基于所述群体应用偏好特征,对所述用户进行画像。本发明提供的群体应用偏好特征表示方法,能够自适应的针对任意的纯文本数据、纯图像数据、图文混合数据提取联合特征,实现对多模态数据的分析处理,在图文模态下,可以增加特征提取的语义交互能力,使得到的群体应用偏好特征更准确,从而提高用户画像的质量。
-
公开(公告)号:CN117149948B
公开(公告)日:2024-07-23
申请号:CN202311056211.2
申请日:2023-08-22
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/33 , G06F16/335 , G06F16/35 , G06F18/241 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于向量动态扰动的新闻脉络关系检测方法及装置,所述方法包括:针对待检测新闻文本对,基于每一新闻文本数据中包含的实体,对新闻文本数据进行文本截取,以得到新文本数据对;获取至少一个预训练模型;基于预训练模型,获取新文本数据对的编码表示;基于待检测新闻文本中包含的事件及事件论元、实体、关键词,对各层CLS关系表示向量进行表示增强;对表示增强的各层CLS嵌入表示进行动态加权平均后,基于平均CLS嵌入表示预测该预训练模型对应的关系预测概率;对至少一个预训练模型对应的关系预测概率进行融合平均,得到待检测新闻文本的关系预测结果。本发明可以提高新闻脉络关系检测任务的准确率和泛化性能。
-
公开(公告)号:CN116367181B
公开(公告)日:2024-02-23
申请号:CN202211679996.4
申请日:2022-12-26
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04W16/22 , H04W16/18 , H04B17/318 , H04B17/336 , H04B17/382 , G06N7/01
摘要: 本发明公开了一种空地融合蜂窝网络中的无人机基站部署方法,包括如下步骤:S1:在地面基站侧和网络侧分别进行信息采集;S2:基于步骤S1中的信息建立系统模型,系统模型包括地面基站参数模型、无人机基站传播模型和无人机基站天线阵列模型;S3:基于地面基站用户的平均传输速率和无人机基站用户的平均传输速率,建立性能评估模型;S4:根据步骤S3的性能评估模型,设置多组网络参数组合进行关键性能指标的数值计算,并根据计算结果选择使关键性能指标达到最大的参数组合,作为最终的参数配置;S5:确定无人机基站的水平位置部署。本发明充分考虑了无人机之间的空间保护距离,尤其适用于无人机基站采用多天线配置的场景。
-
公开(公告)号:CN117149948A
公开(公告)日:2023-12-01
申请号:CN202311056211.2
申请日:2023-08-22
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/33 , G06F16/335 , G06F16/35 , G06F18/241 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于向量动态扰动的新闻脉络关系检测方法及装置,所述方法包括:针对待检测新闻文本对,基于每一新闻文本数据中包含的实体,对新闻文本数据进行文本截取,以得到新文本数据对;获取至少一个预训练模型;基于预训练模型,获取新文本数据对的编码表示;基于待检测新闻文本中包含的事件及事件论元、实体、关键词,对各层CLS关系表示向量进行表示增强;对表示增强的各层CLS嵌入表示进行动态加权平均后,基于平均CLS嵌入表示预测该预训练模型对应的关系预测概率;对至少一个预训练模型对应的关系预测概率进行融合平均,得到待检测新闻文本的关系预测结果。本发明可以提高新闻脉络关系检测任务的准确率和泛化性能。
-
公开(公告)号:CN116367181A
公开(公告)日:2023-06-30
申请号:CN202211679996.4
申请日:2022-12-26
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04W16/22 , H04W16/18 , H04B17/318 , H04B17/336 , H04B17/382 , G06N7/01
摘要: 本发明公开了一种空地融合蜂窝网络中的无人机基站部署方法,包括如下步骤:S1:在地面基站侧和网络侧分别进行信息采集;S2:基于步骤S1中的信息建立系统模型,系统模型包括地面基站参数模型、无人机基站传播模型和无人机基站天线阵列模型;S3:基于地面基站用户的平均传输速率和无人机基站用户的平均传输速率,建立性能评估模型;S4:根据步骤S3的性能评估模型,设置多组网络参数组合进行关键性能指标的数值计算,并根据计算结果选择使关键性能指标达到最大的参数组合,作为最终的参数配置;S5:确定无人机基站的水平位置部署。本发明充分考虑了无人机之间的空间保护距离,尤其适用于无人机基站采用多天线配置的场景。
-
公开(公告)号:CN115982111A
公开(公告)日:2023-04-18
申请号:CN202211660716.5
申请日:2022-12-22
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/17 , G06F16/18 , H04L61/4511 , H04L101/69 , H04L101/668
摘要: 本发明公开了一种基于IP访问特征的用户群体画像方法,涉及网络治理技术领域,该方法首先根据日志的访问域名的类别信息,通过数理统计的方法构建IP访问特征数据集,然后,基于用户群体划分算法识别特定群体和非特定群体,最后,构建用户群体属性标签体系,对划分的群体进行群体画像分析,在充分研究原始日志的基础上,以IP访问特征为着力点,设计了基于规则和机器学习相结合的用户群体划分算法,根据日志数据量大的特点,研究了在大数据情况下,优化机器学习算法效率的方法。
-
公开(公告)号:CN110061975A
公开(公告)日:2019-07-26
申请号:CN201910249260.5
申请日:2019-03-29
申请人: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: H04L29/06
摘要: 本发明涉及一种基于离线流量包解析的仿冒网站识别方法,包括:根据已知网站信息库训练随机森林分类器,以构建对仿冒网站的判别模型;获取待检测网站的数据流并保存为离线流量包,通过该离线流量包得到该待检测网站的网站信息;根据该已知网站信息库对该网站信息进行规则匹配,对匹配为仿冒网站的待检测网站进行标识,将匹配失败的网站信息通过该判别模型进行判别,并对判别为仿冒网站的待检测网站进行标识。
-
公开(公告)号:CN116702094B
公开(公告)日:2023-12-22
申请号:CN202310957274.9
申请日:2023-08-01
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F18/26 , G06F18/25 , G06F18/213 , G06F18/22 , G06F18/27 , G06N3/045 , G06N3/044 , G06N3/0442 , G06N3/0464 , G06N3/08
摘要: 本发明涉及数据处理技术领域,提供一种群体应用偏好特征表示方法,其中方法包括:获取用户的交互数据;基于多模态预训练模型,提取所述交互数据的特征表示;基于所述交互数据的特征表示,确定所述交互数据的群体应用偏好特征;基于所述群体应用偏好特征,对所述用户进行画像。本发明提供的群体应用偏好特征表示方法,能够自适应的针对任意的纯文本数据、纯图像数据、图文混合数据提取联合特征,实现对多模态数据的分析处理,在图文模态下,可以增加特征提取的语义交互能力,使得到的群体应用偏好特征更准确,从而提高用户画像的质量。
-
-
-
-
-
-
-
-
-