-
公开(公告)号:CN115309899B
公开(公告)日:2023-05-16
申请号:CN202210949186.X
申请日:2022-08-09
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F18/22 , G06F40/284 , G06N3/0455
Abstract: 本发明公开了一种文本中特定内容识别存储方法及系统,属于文特定词识别的技术领域,其方法包括生成特定词库和规则库;获取待识别的文本集合;提取当前特定文本数据集中的新特定词,得到新特定词集合;将需要训练的词组输入BERT模型;从特定文本中获取疑似新特定词集合,利用BERT模型计算特定词库中各词的特征向量与疑似新特定词集合中各词的特征向量的余弦相似度,并基于计算结果判定新特定词。本发明解决了现有技术中基于预构建模式规则的匹配方式仅局限于特定匹配规则模式,匹配方式不够灵活,结果不够全面,难以及时识别海量新出现的特定词及其变体词,且由于文本中涉及大量错综复杂的词语,容易造成特定词的模糊匹配,导致误识别的问题。
-
公开(公告)号:CN115309899A
公开(公告)日:2022-11-08
申请号:CN202210949186.X
申请日:2022-08-09
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06K9/62 , G06F40/284
Abstract: 本发明公开了一种文本中特定内容识别存储方法及系统,属于文特定词识别的技术领域,其方法包括生成特定词库和规则库;获取待识别的文本集合;提取当前特定文本数据集中的新特定词,得到新特定词集合;将需要训练的词组输入BERT模型;从特定文本中获取疑似新特定词集合,利用BERT模型计算特定词库中各词的特征向量与疑似新特定词集合中各词的特征向量的余弦相似度,并基于计算结果判定新特定词。本发明解决了现有技术中基于预构建模式规则的匹配方式仅局限于特定匹配规则模式,匹配方式不够灵活,结果不够全面,难以及时识别海量新出现的特定词及其变体词,且由于文本中涉及大量错综复杂的词语,容易造成特定词的模糊匹配,导致误识别的问题。
-
公开(公告)号:CN113536077B
公开(公告)日:2022-06-17
申请号:CN202110606596.X
申请日:2021-05-31
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06F16/953 , G06F16/901 , G06N20/00
Abstract: 本发明公开了一种移动APP特定事件内容检测方法,涉及网络信息安全和自然语言处理交叉技术领域。首先获取互联网上特定事件的若干内容作为原始语料,从中抽取原始关键词;针对原始语料构建关键词关系图,并对关键词关系图进行聚类,得到若干簇;对同一簇中的关键词进行量化和排序,得到最能够表达该事件的特征关键词;将特征关键词输入到APP搜索框中进行自动化检索,保存结果;使用机器学习算法对保存结果进行分析,实现了移动APP中特定事件的自动、高效检测分析。本发明以很低的搜索成本获得了不同移动应用针对特定事件的舆论观点和舆论走向信息。本发明还公开了一种移动APP特定事件内容检测装置。
-
公开(公告)号:CN113536077A
公开(公告)日:2021-10-22
申请号:CN202110606596.X
申请日:2021-05-31
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06F16/953 , G06F16/901 , G06N20/00
Abstract: 本发明公开了一种移动APP特定事件内容检测方法,涉及网络信息安全和自然语言处理交叉技术领域。首先获取互联网上特定事件的若干内容作为原始语料,从中抽取原始关键词;针对原始语料构建关键词关系图,并对关键词关系图进行聚类,得到若干簇;对同一簇中的关键词进行量化和排序,得到最能够表达该事件的特征关键词;将特征关键词输入到APP搜索框中进行自动化检索,保存结果;使用机器学习算法对保存结果进行分析,实现了移动APP中特定事件的自动、高效检测分析。本发明以很低的搜索成本获得了不同移动应用针对特定事件的舆论观点和舆论走向信息。本发明还公开了一种移动APP特定事件内容检测装置。
-
公开(公告)号:CN117632041A
公开(公告)日:2024-03-01
申请号:CN202410102237.4
申请日:2024-01-25
Applicant: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心 , 南开大学
Inventor: 贾云刚 , 刘健 , 刘铭 , 许光全 , 闫莉莉 , 李鹏霄 , 光炫 , 贺欣 , 朱佳伟 , 李晓华 , 赵志云 , 井雅琪 , 吕东 , 马宏远 , 张震 , 段东圣 , 高一骄 , 刘秀龙 , 孙捷 , 孙海亮
IPC: G06F3/06 , G06F11/10 , H04L67/1097
Abstract: 本发明提供一种基于再生码的分布式存储方法、装置和电子设备,属于分布式存储技术领域。该方法包括:获取待存储的原始数据,确定原始数据对应的原始数据向量;确定分布式存储系统中各系统节点的编码矩阵以及分布式存储系统中各校验节点的编码矩阵;基于各系统节点的编码矩阵和原始数据向量分别确定各系统节点存储的第一再生码数据向量;基于各校验节点的编码矩阵和原始数据向量分别确定各校验节点存储的第二再生码数据向量。将第一再生码数据向量发送至对应的系统节点进行存储,将第二再生码数据向量发送至对应的校验节点进行存储。本方案通过以向量为单位进行存储,通信过程中是对每个单位向量整体进行编解码,节约了计算资源。
-
公开(公告)号:CN117574412A
公开(公告)日:2024-02-20
申请号:CN202410060420.2
申请日:2024-01-16
Applicant: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心
Inventor: 贾云刚 , 王建礼 , 刘铭 , 许光全 , 李鹏霄 , 崔婧怡 , 刘健 , 段东圣 , 井雅琪 , 赵曦滨 , 赵志云 , 赵淳璐 , 贺欣 , 马宏远 , 张震 , 高一骄 , 武南南 , 孙捷 , 孙海亮 , 刘秀龙
Abstract: 本申请实施例提供一种多方隐私求交方法、装置和电子设备,涉及数据处理技术领域,应用于目标参与方,多个参与方包括目标参与方和其他参与方,该方法包括:依次接收其他参与方发送的多个隐私信息,各隐私信息包括其他参与方的签名信息和第一哈希表数据片段;基于多个隐私信息中的签名信息,对其他参与方的身份进行验证;在其他参与方的身份验证通过的情况下,基于多个第一哈希表数据片段和目标参与方的哈希表数据,确定其他参与方和目标参与方之间的隐私求交结果。这样在计算多个参与方的隐私求交结果时,可以有效地实现隐私求交结果的计算效率和参与方之间的通信效率的平衡。
-
公开(公告)号:CN116127964A
公开(公告)日:2023-05-16
申请号:CN202211600947.7
申请日:2022-12-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心天津分中心
IPC: G06F40/284 , G06F40/30 , G06F16/35 , H04L9/40 , H04W12/12
Abstract: 本发明公开了一种融合传播关系的诈骗信息的检测方法。该方法包括:获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个目标信息组的诈骗权重值;在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。本发明解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
-
公开(公告)号:CN117574412B
公开(公告)日:2024-04-02
申请号:CN202410060420.2
申请日:2024-01-16
Applicant: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心
Inventor: 贾云刚 , 王建礼 , 刘铭 , 许光全 , 李鹏霄 , 崔婧怡 , 刘健 , 段东圣 , 井雅琪 , 赵曦滨 , 赵志云 , 赵淳璐 , 贺欣 , 马宏远 , 张震 , 高一骄 , 武南南 , 孙捷 , 孙海亮 , 刘秀龙
Abstract: 本申请实施例提供一种多方隐私求交方法、装置和电子设备,涉及数据处理技术领域,应用于目标参与方,多个参与方包括目标参与方和其他参与方,该方法包括:依次接收其他参与方发送的多个隐私信息,各隐私信息包括其他参与方的签名信息和第一哈希表数据片段;基于多个隐私信息中的签名信息,对其他参与方的身份进行验证;在其他参与方的身份验证通过的情况下,基于多个第一哈希表数据片段和目标参与方的哈希表数据,确定其他参与方和目标参与方之间的隐私求交结果。这样在计算多个参与方的隐私求交结果时,可以有效地实现隐私求交结果的计算效率和参与方之间的通信效率的平衡。
-
公开(公告)号:CN117172245A
公开(公告)日:2023-12-05
申请号:CN202310610786.8
申请日:2023-05-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F18/24 , G06F18/22
Abstract: 本发明实施例涉及一种控制方法及控制系统,所述方法包括:当检测到目标账号存在新发布的目标文章时,对所述目标文章进行引流标题的先验检测,得到先验检测结果,所述引流标题表征所述目标文章的文章类别;在所述先验检测结果满足预设条件时,对所述目标文章进行引流标题的后验检测,得到后验检测结果;根据所述先验检测结果和所述后验检测结果对所述目标账号进行分数评估,得到所述目标账号的评分结果;根据所述评分结果对所述目标账号进行控制。由此,可以实现对作者账号的调控机制限定,维护平台生态环境以及提高用户体验的技术效果。
-
公开(公告)号:CN116992128A
公开(公告)日:2023-11-03
申请号:CN202310761657.9
申请日:2023-06-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F18/24 , G06Q10/0639
Abstract: 本申请公开了一种检测推荐系统的推荐结果多样性的方法及设备,包括:获取所述推荐系统的推荐结果,并基于预设主题分类模型对所述推荐结果进行分类,以获得推荐内容的主题类别;确定推荐内容的主题类别中,相似的主题内容,通过预设情感立场检测模型进行情感立场检测;根据情感立场检测结果,计算考虑情感立场多样性的多样性评价指标。本申请的方法将情感立场维度的多样性融入到推荐系统多样性指标中,由此提出了一种考虑了情感立场多样性的推荐系统多样性检测方法。