-
公开(公告)号:CN113239663A
公开(公告)日:2021-08-10
申请号:CN202110309085.1
申请日:2021-03-23
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F40/126 , G06F40/216 , G06F40/242 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于知网的多义词中文实体关系识别方法,其步骤包括:1)对中文网事数据中的每一条语料样本基于知网进行字颗粒度的向量化,得到每一个字对的字颗粒度向量;然后对每一字颗粒度向量所在的位置信息进行编码,得到语料中每个字与预标注的待识别实体关系对的相对位置编码;2)根据步骤1)所得结果生成每一语料样本的字颗粒度语义向量集合;3)基于知网生成每一语料的词颗粒度语义向量集合;4)利用各语义向量及其对应位置编码训练深度自注意力神经网络,得到深度自注意力神经网络编码器;5)生成待处理语料中字和词汇的语义向量及其对应位置编码输入深度自注意力神经网络编码器,得到该待处理语料中的实体关系。
-
公开(公告)号:CN111694952A
公开(公告)日:2020-09-22
申请号:CN202010299741.X
申请日:2020-04-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/31 , G06F16/335
Abstract: 本发明公开了一种基于微博的大数据分析模型系统及其实现方法,该实现方法包括以下步骤:步骤1、首先对收集的数据进行清洗和预处理工作,然后对数据进行人工标注;步骤2、模型训练阶段,采用SVM、cnnrnn结合Bert预训练模的方式进行模型训练;步骤3、在次人工标注的训练集上进行模型训练;步骤4、通过对比真实数据标签和预测结果,不断迭代优化通过不断的迭代优化参数调优的方式得到最佳模型;步骤5、在海量的文章中聚类,通过simHash算法,对文章内容进行局部HASH;步骤6、把选择出来的HASH对应的文章查询出来,再通过机器学习的算法进行聚类。本发明能够在保证模型准确率的基础上可以有效地减少机器需求,提高模型的准确率以及鲁棒性。
-
公开(公告)号:CN119106199A
公开(公告)日:2024-12-10
申请号:CN202310657378.8
申请日:2023-06-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/906 , G06F16/904 , G06Q50/00
Abstract: 本发明提出一种面向社交媒体的迭代式线索发现方法和系统。包括融合文本、结构和互动信息的线索主体重要度评分方法。通过对候选账号的文本内容、社交网络结构和互动信息分别进行建模,分别得到内容、结构和互动三个维度的重要度评分,再对多个维度的评分进行加权,得到最终的线索主体重要度评分。选取分数最高的作为线索发现结果。该方法及系统可以综合利用社交媒体平台中的内容、结构以及互动信息对线索主体进行评分,提升线索主体识别的准确率。
-
公开(公告)号:CN115129884A
公开(公告)日:2022-09-30
申请号:CN202210605631.0
申请日:2022-05-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了基于语义交互匹配网络的知识图谱补全方法,其包括以下步骤:S1、将数据集划分为训练子集、验证子集和测试子集;S2、设定初始参数K、θ1、θ2;S3、构建支持集、查询集和负样本集;S4、获取第一子图表示、第二子图表示和第三子图表示;S5、计算得相似度得分一和相似度得分二;S6、计算损失函数值L;S7、获取知识谱图补全模型;S8、将补全信息补入至待补全的知识图谱中。本发明通过捕获实体邻居之间的语义交互来增强实体表示,实现了对小样本数据的知识图谱的补全工作,并取得了较好的成果,大大提升了知识图谱补全技术的泛用性、可拓展性,促进了知识图谱在当前尚不完善的特定领域的普及。
-
公开(公告)号:CN113255918A
公开(公告)日:2021-08-13
申请号:CN202110393843.2
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06N5/04 , G06F16/36 , G06N5/02 , G06K9/62 , G06F40/126
Abstract: 本发明公开了一种强化聚合知识指导的生成常识推理方法,包括:基于知识图谱构建概念推理图和分层概念扩展图;搭建强化聚合指导下基于概念推理图的知识图谱增强型编码器;搭建强化聚合指导下基于分层概念扩展图的知识图谱增强型解码器;训练包含知识图谱增强型编码器和知识图谱增强型解码器的生成常识推理模型;应用训练后的生成常识推理模型生成常识推理语句。本发明提供的方法可以有效避免因未考虑概念之间关系而导致生成语句不符合日常情景、逻辑不合理等一系列问题,通过引入强化聚合过程从知识图谱中筛选能提供丰富关系信息的附加概念描述,有效提升了模型对不可见概念集的概括。
-
公开(公告)号:CN109992645B
公开(公告)日:2021-05-14
申请号:CN201910250572.8
申请日:2019-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 拓尔思信息技术股份有限公司
Abstract: 本发明公开了一种基于文本数据的资料管理系统及方法,属于信息管理系统领域。资料管理系统包括数据上传模块,数据存储模块,数据解析模块,数据检索模块,数据可视化模块,工具箱和管理台。所述方法首先将本地文件利用数据上传模块上传至数据存储模块,然后数据解析模块对上传文件进行解析处理,得到上传文件的属性并进行存储。将解析后的资料内容及附件分别存储在数据存储模块中的全文索引搜索引擎数据库和关系型数据库中。最后采用相似性判断技术,利用数据检索模块对存储到数据库中的资料进行检索;利用数据可视化模块对所有资料内容按分类进行展示、文档操作功能和各种可视化展示。本发明提高了工作效率,提升了对战略研究素材的管理能力。
-
公开(公告)号:CN112214558A
公开(公告)日:2021-01-12
申请号:CN202011296138.2
申请日:2020-11-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/28 , G06F16/33 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种主题相关度判别方法及装置,方法包括:对获取的网页构建网页特征向量;利用预先训练的语义向量空间模型对选定的主题特征向量与网页特征向量之间的相似度进行计算;筛选出相似度高于预设值的网页特征向量。本申请结合了语义向量相似度计算和机器学习方法的优点,相比于现有技术,可以实现较高的判别精度,并且本申请在训练样本的筛选上也作出了不同于现有技术的改进。
-
公开(公告)号:CN111858728A
公开(公告)日:2020-10-30
申请号:CN202010605313.5
申请日:2020-06-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/25
Abstract: 本发明公开了不同数据源的数据抽取方法,包括:获取数据源和数据源属性名,计算数据源属性名与预设属性名的相似度,若所述相似度大于预设阈值,则建立所述数据源属性名与所述预设属性名的映射关系,构建属性名映射表;根据所述属性名映射表,获取与所述预设属性名对应的不同数据源,根据数据源的优先级,按照设定的抽取规则抽取数据入库;以及,不同数据源的数据抽取装置,设备和存储介质。本发明通过自动化创建属性名映射表,可以对不同数据源的数据进行自动抽取,高效地构建不同领域的知识库并自动化更新,成本低。
-
公开(公告)号:CN117520570A
公开(公告)日:2024-02-06
申请号:CN202310693072.8
申请日:2023-06-12
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/38 , G06F16/25 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06F18/241
Abstract: 本发明公开了一种面向政策文件的智能文本辅助处理系统,属于信息管理领域,具体包括:采集层,数据层,处理层和应用层;所述采集层基于雷达采集软件、python技术以及大数据中心数据推送的方式对政策文件的相关信息进行获取;数据层通过ETL技术将数据载入至数据库;处理层对数据进行清洗加工和智能分析,供应用层使用;应用层实现信息可视化展示、快速检索、自动分类、多语言翻译、引用规范化和语音转写等。本发明具有高效性和易用性,在信息系统管理等领域有重要应用价值。
-
公开(公告)号:CN111930957A
公开(公告)日:2020-11-13
申请号:CN202010598739.2
申请日:2020-06-28
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明实施例公开了实体间亲密度的分析方法、装置、电子设备以及存储介质。所述方法包括:获取知识图谱中的多个实体以及所述多个实体之间的关系;根据所述多个实体中两个实体与所述多个实体中的其他实体之间的关系,确定所述两个实体之间的关系关联度;根据所述两个实体之间的关系关联度,确定所述两个实体之间的亲密度。基于该方法和装置,可以从实体间关系维度对实体间亲密度的分析,提高了实体间亲密度分析的全面性。
-
-
-
-
-
-
-
-
-