-
公开(公告)号:CN117234572A
公开(公告)日:2023-12-15
申请号:CN202310892421.9
申请日:2023-07-20
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F8/70 , G06F8/71 , G06F8/74 , G06N3/0464 , G06N3/08
摘要: 本发明涉及多模态数据提取技术领域,尤其为一种基于游戏引擎的多模态数据提取方法,包括如下步骤包括如下步骤:S1:通过对游戏文件逆向,获得游戏的资源文件;S2:通过对资源文件引擎特征提取,获得游戏资源文件中的游戏引擎;S3:通过对游戏资源文件中的游戏引擎进行特征融合获得融合特征进行多模态数据提取。本发明通过逆向手段分析游戏引擎,从游戏引擎对资源文件打包开始,深入研究打包流程和打包过程中使用的技术,无需运行游戏,直接从游戏安装路径下对资源文件提取,减少了资源浪费问题。
-
公开(公告)号:CN110134947B
公开(公告)日:2021-03-26
申请号:CN201910307654.1
申请日:2019-04-17
申请人: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
-
公开(公告)号:CN107135281B
公开(公告)日:2020-03-31
申请号:CN201710146433.1
申请日:2017-03-13
申请人: 国家计算机网络与信息安全管理中心 , 北京信息科技大学
摘要: 本发明实施例提供一种基于多数据源融合的IP地域类特征提取方法,包括:步骤1、基于现有的IP地址定位数据库,计算每一定位数据库的权威度;步骤2、基于现有的IP地址定位数据库,计算每一定位数据库中定位数据的完整度;步骤3、根据步骤1和步骤2中的每一定位数据库的权威度和每一定位数据库中定位数据的完整度,确定定位数据的可信度;步骤4、根据定位数据的可信度,选取定位数据构建IP地域类特征知识库。
-
公开(公告)号:CN106970962A
公开(公告)日:2017-07-21
申请号:CN201710170469.3
申请日:2017-03-21
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F17/30
CPC分类号: G06F16/95 , G06F16/951
摘要: 本发明公开了一种获取搜索引擎搜索结果的方法和装置。所述方法包括:输入待测试的搜索引擎、关键词和页码;将关键词和页码输入搜索引擎对应的搜索引擎模板,获得关键词和页码对应的一级页面地址;将一级页面地址输入到预设的浏览器中,通过浏览器访问一级页面地址,并获取一级页面地址对应一级页面信息和二级页面信息。本发明采用自动化的方式获取搜索引擎的搜索结果,通过预先设置搜索引擎模板的方式,自动获得一级页面地址,并将一级页面地址输入预设的浏览器中,进而通过访问该一级页面地址,自动获得所需的一级页面信息和二级页面信息。通过本发明可以有效提升搜索验证效率和准确率,提高搜索效果以及获得搜索结果的效率。
-
公开(公告)号:CN117391072A
公开(公告)日:2024-01-12
申请号:CN202311173762.7
申请日:2023-09-12
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/279 , G06F40/216 , G06F16/35 , G06N3/0464 , G06N3/09
摘要: 本发明提供了一种基于遮挡语言模型的文本纠错方法、系统、设备及介质,能够通过无监督学习大量语料文本的方式,完成对文本的智能纠错,不需要人工标记的大量语料。本发明在不需要准备专门的平行语料的情况下完成中文文本纠错的任务,只需要提供大量中文语言的文本给语言模型自动进行训练即可,采用无监督学习大量语言文本的方式拓展了平行语料范围有限造成的局限性,不需要人工标记的大量语料。本发明采用遮挡语言模型的方式进行文本纠错,其过程中通过无监督学习大量语料文本的方式,完成对文本的智能纠错,应用于针对中文文本纠错的系统中,发现并纠错文本中在输入等过程中产生的错误。
-
公开(公告)号:CN109241438B
公开(公告)日:2022-06-24
申请号:CN201811128658.5
申请日:2018-09-27
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/9535 , G06F40/30 , G06F40/284
摘要: 本发明公开了一种基于要素的跨通道热点事件发现方法、装置及存储介质,本发明融合某一领域的新闻报道数据与微博数据,通过联合两个通道提取的要素与文本语义相似度分析,有利于发现该领域热点事件,并且更全面细致的了解热点事件。
-
公开(公告)号:CN110889115A
公开(公告)日:2020-03-17
申请号:CN201911081426.3
申请日:2019-11-07
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F21/56
摘要: 本发明公开了一种恶意推送行为检测方法及装置,所述方法包括:对应用程序进行过滤,筛选出带有系统通知栏推送的应用程序;对筛选出的应用程序分别进行动态分析和静态分析,获取动态分析结果和静态分析结果;对所述动态分析结果和所述静态分析结果进行研判,确定具有恶意推送行为的应用程序。
-
公开(公告)号:CN109471932A
公开(公告)日:2019-03-15
申请号:CN201811415780.0
申请日:2018-11-26
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/332 , G06F16/35 , G06F17/27 , G06N3/08
摘要: 本发明公开了一种基于学习模型的谣言检测方法、系统及存储介质,其中检测方法包括:构建新闻语料库;构建博文语料库;对新闻语料库中的数据进行模型训练,获得第一分类器模型;对博文语料库中的数据进行特征提取,获得训练特征,利用训练特征进行模型训练获得第二分类器模型;利用第一分类器模型和第二分类器模型对社交平台中的博文数据进行谣言检测。本发明通过对新闻数据中的谣言和非谣言数据进行采集构建新闻语料库,再进行模型训练获得第一训练模型;再对社交平台中的谣言和非谣言数据进行采集构建博文语料库,再进行模型训练获得第二训练模型,最后利用两个训练模型对社交平台中的数据进行谣言检测,使最终的检测结果更加准确可靠。
-
公开(公告)号:CN105846982A
公开(公告)日:2016-08-10
申请号:CN201610285419.5
申请日:2016-04-29
申请人: 国家计算机网络与信息安全管理中心
CPC分类号: H04L5/0055 , G06F21/602 , H04L1/0061 , H04L1/1657 , H04L1/1806 , H04L63/0428 , H04L69/164
摘要: 本发明提出了一种跨域传输的方法,该方法包括:在发送终端,按顺序对每个待发送信息进行编号,并对经过编号的每个待发送信息进行分解得到多个数据包,并按顺序为每个数据包编号;为任一待发送信息中的首个数据包添加包头信息,为所述任一待发送信息中的其他数据包添加编号信息;将经过编号的待发送信息中的数据包通过用户数据报协议UDP传输至接收终端。在接收终端,接收发送终端传输来的数据包,并按照所述数据包的包头信息或编号信息对所述数据包进行重组,形成接收信息。该方法能够减少数据反馈量、提高传输速率、增强可靠性。
-
公开(公告)号:CN118051623A
公开(公告)日:2024-05-17
申请号:CN202410028993.7
申请日:2024-01-08
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/36 , G06F16/35 , G06N5/025 , G06N5/04 , G06F40/295 , G06F40/30 , G06F40/289 , G06F16/951 , G06F16/9535 , G06F16/9538 , H04L67/55
摘要: 本发明涉及人工智能和知识工程技术领域,本发明提供了一种移动应用知识库构建系统和方法,能够实现面向移动应用知识库的构建,完成移动应用知识库的智能应用。本发明移动应用知识库构建系统,基于APP(应用)基础信息和内容数据的多源异构数据,通过应用实体抽取、属性抽取、关系抽取等结构化处理,结合移动APP推理规则和移动APP标签图谱实现,为移动APP相似性、关联性分析以及移动应用内容分析、风险研判等建立基于检索式的知识服务方式,提供了一种面向移动应用的知识库,是一套面向业务应用的知识属性体系,提高相关的工作和生产效率。
-
-
-
-
-
-
-
-
-