-
公开(公告)号:CN116127964A
公开(公告)日:2023-05-16
申请号:CN202211600947.7
申请日:2022-12-13
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心天津分中心
IPC: G06F40/284 , G06F40/30 , G06F16/35 , H04L9/40 , H04W12/12
Abstract: 本发明公开了一种融合传播关系的诈骗信息的检测方法。该方法包括:获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个目标信息组的诈骗权重值;在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。本发明解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
-
公开(公告)号:CN118734928A
公开(公告)日:2024-10-01
申请号:CN202410629625.8
申请日:2024-05-21
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本公开涉及一种微调指令的构造方法、装置、设备及介质,该方法包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本公开针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。
-
公开(公告)号:CN118627581A
公开(公告)日:2024-09-10
申请号:CN202410753364.0
申请日:2024-06-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N3/082 , G06N3/045 , G06N3/0499 , G06N3/084
Abstract: 本发明属于人工智能技术领域,涉及一种基于输入激活的大语言模型低秩近似剪枝方法和装置。该方法包括:根据权重和输入激活计算剪枝指标;根据剪枝指标对大语言模型的线性层的每个输出进行局部权重的比较和修剪;使用低秩近似法对剪枝后的大语言模型进行微调以促进大语言模型性能的恢复。本发明能够有效地压缩LLMs,实现了较高的计算效率,在单个前向传播中执行,并且只有很小的内存开销,不仅避免了在局部分层重建过程中计算逆矩阵,而且保持了与幅值剪枝一样的简洁性。
-
公开(公告)号:CN110852090B
公开(公告)日:2024-03-19
申请号:CN201911080694.3
申请日:2019-11-07
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , H04L41/147
Abstract: 本发明提供了一种用于舆情爬取的机构特征词汇扩展系统,包括:数据采集模块:用于采集数据;特征词清洗加工模块:用于对特征词进行初步筛选;特征词统计分析模块:用于通过相关度分析,进一步筛选特征词,最终生成拓展特征词。本发明另一方面提供了一种用于舆情爬取的机构特征词汇扩展方法,采用上述方案,筛选掉无用特征词并进行分析,生成拓展特征词,全面、快速采集相关舆情信息,一方面有效的避免了漏查情况的发生,另一方面也减少了无用特征词增加无用的数据,提高检索效率和质量,减少内存的占用。
-
公开(公告)号:CN116070266A
公开(公告)日:2023-05-05
申请号:CN202211731149.8
申请日:2022-12-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请提供了一种社交网络图结构匿名化处理方法及装置,属于数据安全技术领域。本申请通过,获取社交网络图结构对应的原始图数据,所述原始图数据中每个节点代表一个用户,任意两个节点间的连线所构成的边代表对应两个用户之间的关系;在所述原始图数据对应的所有的边中确定隐私边,并在所述原始图数据中删除所述隐私边得到预处理图;将所述预处理图输入至预先训练好的匿名图生成模型,以使所述匿名图生成模型输出对应的匿名图;其中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征,并基于所述图嵌入特征输出对应的匿名图。由此可以有效抵御攻击者结合图嵌入技术进行的推断攻击,提高匿名处理的安全性。
-
公开(公告)号:CN113378090B
公开(公告)日:2022-09-06
申请号:CN202110445408.X
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。
-
公开(公告)号:CN113076464B
公开(公告)日:2022-07-22
申请号:CN202110392387.X
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/332 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于重构编码异常检测的多通道网络线索发现方法及装置,该方法步骤如下:步骤一、构建面向暗网、telegram、区块链交易网络的正则化多通道网络并进行节点对齐;步骤二、基于多通道图表征重构的特征表示学习的线索检测:该装置包括:多通道网络构建与对齐模块、多通道图表征重构的特征表示学习的线索检测模块。本发明可实现对暗网、国外主流即时通讯工具等多通道的网络进行监测,实现网络异常发现和内容管控,实现针对不良信息发现,或者一些网络异常行为的发现。
-
公开(公告)号:CN113850064A
公开(公告)日:2021-12-28
申请号:CN202111076579.6
申请日:2021-09-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/186
Abstract: 本发明公开了一种基于终身学习的金融领域事件抽取方法及装置,其中,该方法包括:配置初始事件抽取模板,其中,所述初始事件抽取模板包括多个事件类型,以及与每个所述事件类型对应的要素角色;采用样本文本信息训练所述初始事件抽取模板,输出目标事件抽取模板,其中,所述初始事件抽取模板包括事件检测模块和要素抽取模块。通过本发明,解决了相关技术中的模型抽取事件信息的效率低的技术问题,提高了事件抽取模型的适应性和通用性。
-
公开(公告)号:CN113704373A
公开(公告)日:2021-11-26
申请号:CN202110955784.3
申请日:2021-08-19
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请提供了一种基于移动轨迹数据的用户识别方法、装置及存储介质,该方法包括:获取任意两条待判别的目标轨迹数据,其中,目标轨迹数据为从目标区域中提取出的路径信息,目标区域为用户访问过的区域;将目标轨迹数据的表征集合输入到目标模型内,判断目标轨迹数据是否来自同一用户,其中,目标模型是由初始判别模型训练得到的,输入初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条初始轨迹数据之间的相似度数值以及用于指示任意两条初始轨迹数据是否来自同一用户的标注信息。通过本申请,解决了相关技术中存在的用户识别准确率较低,稳定性不高的问题。
-
公开(公告)号:CN111914542A
公开(公告)日:2020-11-10
申请号:CN202010437168.4
申请日:2020-05-21
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F40/279 , G06F40/216 , G06Q40/02 , G06Q50/26
Abstract: 本申请实施例提供了疑似非法集资市场主体识别方法、装置、终端及存储介质,涉及金融安全领域。本申请通过从互联网公开数据中获取与市场主体相关联的文本数据;通过预先训练的数据识别模型,从文本数据中识别出非法集资线索数据;将非法集资线索数据输入到预先训练的市场主体抽取模型中,得到疑似非法集资市场主体。本方案可以从互联网公开数据中自动识别出疑似非法集资行为的线索信息,定位疑似非法集资市场主体,从而提高识别非法集资市场主体的效率。
-
-
-
-
-
-
-
-
-