-
公开(公告)号:CN113761215A
公开(公告)日:2021-12-07
申请号:CN202110321491.X
申请日:2021-03-25
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
Inventor: 赵忠华 , 李建广 , 余智华 , 王禄恒 , 陈欣洁 , 赵志云 , 冯凯 , 葛自发 , 杜漫 , 孙小宁 , 穆庆伟 , 万欣欣 , 申双成 , 李欣 , 孙立远 , 付培国 , 王晴 , 杜宛真
IPC: G06F16/36 , G06F16/35 , G06F40/242 , G06F40/295
Abstract: 本发明公开了一种基于反馈自学习的动态字典库生成方法,包括以下步骤:S1、字典库定义;S2、基于字典库分类体系;S4、基于语料库导出的标注数据,配合模型参数调整,逐步迭代优化模型;S5、将S4步生成的预测数据回填到字典库。有益效果:该方法通过概念模式定义、自然语言处理技术、全流程调度机制,实现从原始语料概念模式定义生成基础字典库,在基础字典库基础上进行标注模型的自动构建、迭代训练及修正,最后再利用标注模型来进行新的语料数据标注,反馈更新字典库,实现从标注训练到反馈自学习的闭环流程,达到模型自动逐步优化能力。最终实现字典库的自动完善,标注模型逐步优化的全自动循环过程。
-
公开(公告)号:CN111353300B
公开(公告)日:2023-09-01
申请号:CN202010093817.3
申请日:2020-02-14
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/289 , G06F18/214 , G06F18/241
Abstract: 本发明提供了一种数据集构建方法及装置,包括步骤:数据采集,获取来自互联网数据源的第一数据,所述第一数据包括自然语言,所述第一数据经过预处理后,生成第二数据;数据特征分析,所述第二数据包括子数据,所述子数据包括第一特征数据,分析所述第一特征数据,得出所述第一特征数据的特征度;数据标签建立,根据所述第一特征数据的特征度确定所述子数据标签;数据分类存储,根据所述子数据标签将所述子数据分类保存,保存为数据集。实时采集互联网中的数据;根据特征数据和特征度提取对应的标签;通过所述子数据标签将所述子数据进行分类提高提取速度,提高工作效率。本发明提供了一种相关信息获取方法及装置,提高准确性,提高工作效率。
-
公开(公告)号:CN111353300A
公开(公告)日:2020-06-30
申请号:CN202010093817.3
申请日:2020-02-14
Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F40/284 , G06F40/289 , G06K9/62
Abstract: 本发明提供了一种数据集构建方法及装置,包括步骤:数据采集,获取来自互联网数据源的第一数据,所述第一数据包括自然语言,所述第一数据经过预处理后,生成第二数据;数据特征分析,所述第二数据包括子数据,所述子数据包括第一特征数据,分析所述第一特征数据,得出所述第一特征数据的特征度;数据标签建立,根据所述第一特征数据的特征度确定所述子数据标签;数据分类存储,根据所述子数据标签将所述子数据分类保存,保存为数据集。实时采集互联网中的数据;根据特征数据和特征度提取对应的标签;通过所述子数据标签将所述子数据进行分类提高提取速度,提高工作效率。本发明提供了一种相关信息获取方法及装置,提高准确性,提高工作效率。
-
公开(公告)号:CN109992514B
公开(公告)日:2023-04-07
申请号:CN201910257181.9
申请日:2019-04-01
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明提供了一种基于可视化内容的移动应用动态分析方法,包括:点击移动应用中各类可视化内容元素,触发移动应用的动态行为,对动态行为进行分类,记录可视化内容元素和对应的动态行为;在记录中提取可视化内容元素的特征向量,根据动态行为分类的结果,构造动态行为关于可视化内容元素特征向量的关系模型;根据关系模型,预测点击待执行动态分析的移动应用的任意可视化内容元素后产生每类动态行为的概率,即动态行为触发概率;根据动态行为触发概率,采用点击策略点击待分析移动应用页面中的可视化内容元素,触发移动应用动态行为,完成对移动应用的动态分析。本发明的方法可以提高移动应用功能性测试效率和安全性测试效率。
-
公开(公告)号:CN115293479A
公开(公告)日:2022-11-04
申请号:CN202210559536.1
申请日:2022-05-23
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了一种舆情分析工作流系统,包括:数据分析功能模块,其包括N个能够进行舆情数据分析的数据分析模块;工作流建立模块,其根据舆情分析需求从数据分析功能模块中选择多个数据分析模块,按顺序进行连接,建立对特定任务进行分析的工作流,针对同一事件不同分析角度的舆情分析需求,建立多个工作流,以对多个舆情分析任务进行分析;工作流管理模块,其对建立的工作流进行数据分析计算,并通过可视化工作流图查看计算结果;事件管理模块,其对同一事件的多个舆情分析任务进行管理,并通过舆情分析数据构建不同任务之间的联系。本发明还提供了舆情分析工作流方法。本系统和方法能够根据舆情分析需求实现从不同层次和不同角度获得舆情信息。
-
公开(公告)号:CN113239663B
公开(公告)日:2022-07-12
申请号:CN202110309085.1
申请日:2021-03-23
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/126 , G06F40/216 , G06F40/242 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于知网的多义词中文实体关系识别方法,其步骤包括:1)对中文网事数据中的每一条语料样本基于知网进行字颗粒度的向量化,得到每一个字对的字颗粒度向量;然后对每一字颗粒度向量所在的位置信息进行编码,得到语料中每个字与预标注的待识别实体关系对的相对位置编码;2)根据步骤1)所得结果生成每一语料样本的字颗粒度语义向量集合;3)基于知网生成每一语料的词颗粒度语义向量集合;4)利用各语义向量及其对应位置编码训练深度自注意力神经网络,得到深度自注意力神经网络编码器;5)生成待处理语料中字和词汇的语义向量及其对应位置编码输入深度自注意力神经网络编码器,得到该待处理语料中的实体关系。
-
公开(公告)号:CN109905873B
公开(公告)日:2021-08-31
申请号:CN201910137453.1
申请日:2019-02-25
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04W8/18 , H04W8/22 , G06F16/2455
Abstract: 本发明涉及一种基于特征标识信息的网络应用账号关联方法,属于信息处理技术领域。本发明方法面向移动互联网用户的固网和移动网上网行为,对客户端和服务器端产生的网络通信日志进行综合分析,重点从明文请求日志中提取出客户端特征标识信息和登录网站账号信息,设计基于特征标识信息和网络账号信息的关联规则,建立基于特征标识信息的网络账号关联方法,提高网络账号之间的关联率和准确率。因此,本发明方法不具体针对跨特定社交平台的网络账号关联范畴,只考虑通过利用运营商提供的网络通信特征信息,建立基于特征标识信息的网络应用账号关联方法,用以解决目前主流移动APP和主流网站网络账号缺少关联条件和关联准确率不高等难题。
-
公开(公告)号:CN113255720A
公开(公告)日:2021-08-13
申请号:CN202110393842.8
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06K9/62 , G06Q50/00 , G06F16/901
Abstract: 本发明公开了一种基于分层图池化的多视角聚类方法,包括以下步骤:将待处理数据划分成多视角数据集,然后将多视角数据集按各视角构建对应的图表示,得到对应的视图;采用分层图池化层迭代计算方法提取每个视图的聚类信息,每个视图的聚类信息包括对应该视图的粗化图和分配矩阵,该粗化图包括迭代后的邻接矩阵、特征矩阵、图拉普拉斯矩阵;采用多视角谱聚类融合方法融合所有视图的聚类信息,得到每一类特征向量所对应的类别。具有充分利用待处理数据本身的多视图特征,可以综合包含原各个视图的聚类信息。公开了一种基于分层图池化的多视角聚类系统,包括:图构建模块、聚类信息计算提取模块、多视角融合模块。本发明具有提升聚类效果的有益效果。
-
公开(公告)号:CN111949848A
公开(公告)日:2020-11-17
申请号:CN202010785632.9
申请日:2020-08-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/951 , G06F16/9536 , G06F16/958 , G06F16/35 , G06F40/295 , G06F40/216
Abstract: 本发明涉及一种基于特定事件的跨平台传播态势评估及分级方法,属于网络信息领域。本发明的基于特定事件的跨平台传播态势评估及分级方法,具体包括四个功能模块,分别为:原始网络元素检测模块、特定事件的话题传播计算模块、话题传播模型参数的等级评定和威胁分析模块、任务调度和优化模块。本发明解决了现有技术中没有考虑到事件的传播态势评估及分级方法,提出了针对特定事件传播情况的量化评估方法和有区分度的分级手段,建立了信息系统框架,实现了对特定事件的跨平台传播态势评估及分级,同时根据特定事件的跨平台传播态势评估对后续监测工作进行指导,从而有效提高对于事件传播的紧急或影响程度的判断能力,用以指导实际工作。
-
公开(公告)号:CN109508471A
公开(公告)日:2019-03-22
申请号:CN201811110142.8
申请日:2018-09-21
Applicant: 长安通信科技有限责任公司 , 国家计算机网络与信息安全管理中心
IPC: G06F17/50
Abstract: 本发明公开了一种运动轨迹补全方法,该方法包括:获取两个相邻轨迹点记录之间的至少两条路径;基于两个相邻轨迹点记录的运动时长利用假设检验从至少两条路径中筛选出补全运动轨迹,补全运动轨迹能够通过假设检验,假设检验的至少部分参数是利用路径对应的相关运动记录得到的。本发明还公开了一种运动轨迹补全装置、可读存储介质。通过上述方式,本发明能够补全运动轨迹缺失的部分。
-
-
-
-
-
-
-
-
-