-
公开(公告)号:CN110852090B
公开(公告)日:2024-03-19
申请号:CN201911080694.3
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , H04L41/147
Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
公开(公告)号:CN116070266A
公开(公告)日:2023-05-05
申请号:CN202211731149.8
申请日:2022-12-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请提供了一种社交网络图结构匿名化处理方法及装置,属于数据安全技术领域。本申请通过,获取社交网络图结构对应的原始图数据,所述原始图数据中每个节点代表一个用户,任意两个节点间的连线所构成的边代表对应两个用户之间的关系;在所述原始图数据对应的所有的边中确定隐私边,并在所述原始图数据中删除所述隐私边得到预处理图;将所述预处理图输入至预先训练好的匿名图生成模型,以使所述匿名图生成模型输出对应的匿名图;其中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征,并基于所述图嵌入特征输出对应的匿名图。由此可以有效抵御攻击者结合图嵌入技术进行的推断攻击,提高匿名处理的安全性。
-
公开(公告)号:CN113378090B
公开(公告)日:2022-09-06
申请号:CN202110445408.X
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。
-
公开(公告)号:CN113076464B
公开(公告)日:2022-07-22
申请号:CN202110392387.X
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/332 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于重构编码异常检测的多通道网络线索发现方法及装置,该方法步骤如下:步骤一、构建面向暗网、telegram、区块链交易网络的正则化多通道网络并进行节点对齐;步骤二、基于多通道图表征重构的特征表示学习的线索检测:该装置包括:多通道网络构建与对齐模块、多通道图表征重构的特征表示学习的线索检测模块。本发明可实现对暗网、国外主流即时通讯工具等多通道的网络进行监测,实现网络异常发现和内容管控,实现针对不良信息发现,或者一些网络异常行为的发现。
-
公开(公告)号:CN113850064A
公开(公告)日:2021-12-28
申请号:CN202111076579.6
申请日:2021-09-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/186
Abstract: 本发明公开了一种基于终身学习的金融领域事件抽取方法及装置,其中,该方法包括:配置初始事件抽取模板,其中,所述初始事件抽取模板包括多个事件类型,以及与每个所述事件类型对应的要素角色;采用样本文本信息训练所述初始事件抽取模板,输出目标事件抽取模板,其中,所述初始事件抽取模板包括事件检测模块和要素抽取模块。通过本发明,解决了相关技术中的模型抽取事件信息的效率低的技术问题,提高了事件抽取模型的适应性和通用性。
-
公开(公告)号:CN113704373A
公开(公告)日:2021-11-26
申请号:CN202110955784.3
申请日:2021-08-19
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请提供了一种基于移动轨迹数据的用户识别方法、装置及存储介质,该方法包括:获取任意两条待判别的目标轨迹数据,其中,目标轨迹数据为从目标区域中提取出的路径信息,目标区域为用户访问过的区域;将目标轨迹数据的表征集合输入到目标模型内,判断目标轨迹数据是否来自同一用户,其中,目标模型是由初始判别模型训练得到的,输入初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条初始轨迹数据之间的相似度数值以及用于指示任意两条初始轨迹数据是否来自同一用户的标注信息。通过本申请,解决了相关技术中存在的用户识别准确率较低,稳定性不高的问题。
-
公开(公告)号:CN111914542A
公开(公告)日:2020-11-10
申请号:CN202010437168.4
申请日:2020-05-21
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/279 , G06F40/216 , G06Q40/02 , G06Q50/26
Abstract: 本申请实施例提供了疑似非法集资市场主体识别方法、装置、终端及存储介质,涉及金融安全领域。本申请通过从互联网公开数据中获取与市场主体相关联的文本数据;通过预先训练的数据识别模型,从文本数据中识别出非法集资线索数据;将非法集资线索数据输入到预先训练的市场主体抽取模型中,得到疑似非法集资市场主体。本方案可以从互联网公开数据中自动识别出疑似非法集资行为的线索信息,定位疑似非法集资市场主体,从而提高识别非法集资市场主体的效率。
-
公开(公告)号:CN111507110A
公开(公告)日:2020-08-07
申请号:CN201910092796.0
申请日:2019-01-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/216 , G06Q50/00
Abstract: 本申请涉及一种突发事件检测方法、装置、设备及存储介质,该方法包括:获取待检测事件的文本数据;提取文本数据中的关键信息,关键信息包括:关键词;根据关键信息生成触发词关系链;在预设的关键词库与触发词关系图的对应关系中,将与关键信息中的关键词对应的触发词关系图确定为目标触发词关系图;计算触发词关系链和目标触发词关系图的匹配度;若匹配度大于预设匹配阈值,则将待检测事件确定为突发事件。该方法可以缓解现有技术中存在的突发事件检测的效率低的问题,达到了提高突发事件检测效率的技术效果。
-
公开(公告)号:CN110837608A
公开(公告)日:2020-02-25
申请号:CN201911080716.6
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F16/9538 , G06F16/951
Abstract: 本发明提供了一种基于多源数据的舆情话题传播路径分析系统,包括:多源数据采集模块,用于对舆情话题进行多源数据采集,获取至少一项来源信息;传播路径分析模块,用于根据来源信息的类型采用不同的单源传播路径建立方案,得到单源传播路径,多个单源传播路径相互关联,得到交叉传播路径;传播主路径分析模块,用于分析各个节点的转发关系和转发量,得到舆情话题的关键传播节点,保留根节点与关键传播节点、关键传播节点之间的传播路径,删掉无关路径,得到传播主路径;路径显示模块,用于显示路径信息。本发明还提供了一种基于多源数据的舆情话题传播路径分析方法,帮助用户更加直观的了解舆情话题的传播情况。
-
公开(公告)号:CN106294332B
公开(公告)日:2020-02-14
申请号:CN201510236598.9
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F40/30 , G06Q50/00
Abstract: 本发明提供一种微博话题特征提取方法及装置,用以解决目前采用静态词典中的词语特征来表示微博文本,会遗漏大量的关键特征,不能准确反映实时微博信息的问题。该方法包括:提取微博中的有意义字符串,有意义字符串为包含具有语义、能够独立使用的语言单元;提取有意义字符串的异质属性信息;根据异质属性信息对有意义字符串进行分类,得到微博话题相关的特征项,采用该方案能提高微博信息中的特征项提取的准确性。
-
-
-
-
-
-
-
-
-