-
公开(公告)号:CN108959351B
公开(公告)日:2022-11-08
申请号:CN201810377825.3
申请日:2018-04-25
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于自然语言处理技术领域,具体提供一种中文篇章关系的分类方法及装置。旨在解决传统管道系统方法中错误传递的问题。本发明的中文篇章关系的分类方法包括将中文篇章中的句子进行句对的分布式表示,得到第一句对分布式表示向量;计算记忆单元与第一句对分布式表示向量的相似度和权重,得到第一句对分布式表示向量的记忆信息;将第一句对分布式表示向量与记忆信息进行线性组合生成第二句对分布式表示向量;对第二句对分布式表示向量进行分类,得到中文篇章的关系分类结果。本发明的方法通过深度学习网络得到句子内部的语义和结构抽象特征,可以获得优越性能的篇章分类效果。
-
公开(公告)号:CN108052576B
公开(公告)日:2021-04-23
申请号:CN201711293661.8
申请日:2017-12-08
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/28 , G06F16/215 , G06F16/35 , G06F16/36 , G06Q50/00
Abstract: 本发明涉及一种事理知识图谱构建方法及系统,该构建系统包括:宏观事件层构建模块、微观知识层构建模块、关系映射模块、本体层构建模块和事理知识图谱生成模块;所述宏观事件层构建模块包括:事件实体抽取单元、事件演化单元和因果关系抽取单元;所述微观知识层构建模块包括:微观实体抽取单元。本发明通过从结构化数据中获取事件实体和微观实体,分别构建宏观事件层和微观实体层,并抽取不同事件实体之间的因果关系映射到微观实体中,通过对微观实体层中微观实体的关系、类型和因果关系进行抽象和归纳,由此判断事件形成突发性群体响应的本质原因,对突发事件进行预警预测。
-
公开(公告)号:CN106294333B
公开(公告)日:2019-10-29
申请号:CN201510236634.1
申请日:2015-05-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/953
Abstract: 本发明提供一种微博突发话题检测方法及装置,用以解决目前微博突发话题难以识别的问题,该方法包括,提取指定的微博数据集合中的特征项,特征项为包含具体语义的语言单元;确定特征项在微博数据集合的文本中的流通度以及特征项当前的热度;以流通度为质量参数项,以热度为位置参数项对特征项进行动力学建模,得到特征项的当前能量和加速度;在得到的能量以及加速度分别大于第一预设值以及第二预设值时,检测突发特征项;根据检测到的突发特征项在同一条微博中同时出现的情况计算突发特征项之间的互信息;当互信息大于第三阈值时,对突发特征项进行合并,得到突发话题,该方案能够提高微博突发话题检测的准确率。
-
公开(公告)号:CN104915392B
公开(公告)日:2019-03-26
申请号:CN201510275479.4
申请日:2015-05-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F17/27 , G06Q50/00 , G06K9/62
Abstract: 本发明公开了一种微博转发行为预测方法及装置,包括:基于微博的用户属性、内容属性和用户行为属性来预测用户是否转发该微博,本发明通过在转发预测中引入用户个人行为,即用户行为特征以及用户兴趣特征,从而有效提高了微博转发行为预测的准确性。
-
公开(公告)号:CN108763333A
公开(公告)日:2018-11-06
申请号:CN201810445536.2
申请日:2018-05-11
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
CPC classification number: G06F17/2795
Abstract: 本发明则提出一种基于社会媒体的事件图谱构建方法,首先进行多源数据预处理,接着对预处理后的数据进行多源事件信息抽取,然后通过事件关系评价对事件间关系进行判定,最后进行实体信息融合,对异构图中的实体进行属性补全。本发明将事件看做抽象实体,基于社会媒体文本数据对抽取事件基本构成要素,事件进行关联,并融合已有结构化知识库构建事件图谱,这样能够提供更全面更直接的面向事件的信息检索服务,还能通过将传统非结构化文本内容的研究转化为基于图的研究,有利于发掘更深层次的信息。
-
公开(公告)号:CN108647318A
公开(公告)日:2018-10-12
申请号:CN201810443980.0
申请日:2018-05-10
Applicant: 北京航空航天大学 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于多源数据的知识融合方法,在融合多个来源的实体数据时,首先分别对每个数据源的属性进行规范化表示,其中包括了同义属性映射和对属性值的数值单位的统一转换,这样对属性的规范化处理可以减少对后续实体比较造成的影响;然后基于实体名和实体属性对实体进行分块聚合,这样仅将同一分块内不同来源的实体作为候选匹配实体对,避免了将两个数据源中所有的实体两两间比较,减少计算复杂度;最后将同一分块内不同来源的实体作为候选实体对,采用实体对齐算法计算实体间的相似度,将匹配得到不同来源中描述同一客观世界的实体对,建立不同数据源之间同一实体的等价链接,并进行实体属性的合并,而对于一个数据源中独有的实体,可以直接添加到知识库中。
-
公开(公告)号:CN105068988B
公开(公告)日:2018-01-30
申请号:CN201510431992.8
申请日:2015-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
Abstract: 本发明涉及一种多维度和多粒度情感分析方法,包括:构建情感资源,即根据特定领域文本的类别体系构建其情感资源;选择情感倾向词,即选择每个类别下的情感词并确定其情感倾向;判别情感倾向性,包括:判断信息资源的类型;从信息资源中获取情感关键词;从信息资源中识别权威发布者,并获取该信息资源的情感分析结果;对社交类信息进行情感分析;对非专有类别社交类信息的情感倾向进行分析;针对专有类别的社交信息进行情感分析。本发明的情感分析方法能够从多维度、多粒度进行情感分析以提供较高的情感分析识别率和精度。
-
公开(公告)号:CN105068988A
公开(公告)日:2015-11-18
申请号:CN201510431992.8
申请日:2015-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
Abstract: 本发明涉及一种多维度和多粒度情感分析方法,包括:构建情感资源,即根据特定领域文本的类别体系构建其情感资源;选择情感倾向词,即选择每个类别下的情感词并确定其情感倾向;判别情感倾向性,包括:判断信息资源的类型;从信息资源中获取情感关键词;从信息资源中识别权威发布者,并获取该信息资源的情感分析结果;对社交类信息进行情感分析;对非专有类别社交类信息的情感倾向进行分析;针对专有类别的社交信息进行情感分析。本发明的情感分析方法能够从多维度、多粒度进行情感分析以提供较高的情感分析识别率和精度。
-
公开(公告)号:CN115694873A
公开(公告)日:2023-02-03
申请号:CN202211020960.5
申请日:2022-08-24
Applicant: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
Inventor: 李鹏霄 , 艾政阳 , 王子涵 , 吕东 , 王红兵 , 时磊 , 翟羽佳 , 余翠玲 , 马宏远 , 庄越淋 , 阿曼太 , 傅强 , 雷小创 , 周忠义 , 梁彧 , 王杰 , 杨满智 , 金红
Abstract: 本发明实施例公开了一种在容器中获取HTTPS明文数据的方法、装置、设备。其中,该方法包括:获取主密钥以及随机值;其中,所述主密钥为客户端与服务器建立传输层安全性协议链路时协商得到;根据所述随机值,确定与所述随机值匹配的密文数据;根据所述主密钥,对所述密文数据进行解密,得到明文数据。本发明的技术方案,降低了在容器中获取HTTPS明文数据的成本,实现了高效抓取沙箱中的HTTPS明文数据。
-
公开(公告)号:CN115309899A
公开(公告)日:2022-11-08
申请号:CN202210949186.X
申请日:2022-08-09
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06K9/62 , G06F40/284
Abstract: 本发明公开了一种文本中特定内容识别存储方法及系统,属于文特定词识别的技术领域,其方法包括生成特定词库和规则库;获取待识别的文本集合;提取当前特定文本数据集中的新特定词,得到新特定词集合;将需要训练的词组输入BERT模型;从特定文本中获取疑似新特定词集合,利用BERT模型计算特定词库中各词的特征向量与疑似新特定词集合中各词的特征向量的余弦相似度,并基于计算结果判定新特定词。本发明解决了现有技术中基于预构建模式规则的匹配方式仅局限于特定匹配规则模式,匹配方式不够灵活,结果不够全面,难以及时识别海量新出现的特定词及其变体词,且由于文本中涉及大量错综复杂的词语,容易造成特定词的模糊匹配,导致误识别的问题。
-
-
-
-
-
-
-
-
-