-
公开(公告)号:CN109977219B
公开(公告)日:2021-04-09
申请号:CN201910207415.9
申请日:2019-03-19
申请人: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC分类号: G06F16/34 , G06F40/211 , G06F40/289 , G06Q30/02 , G06Q30/06 , G06Q50/30
摘要: 本发明公开了基于启发式规则的文本摘要自动生成方法,包括:S1、以文本的段落、句子顺序作为启发式语序,将新闻正文分为开始段落、中间段落和结尾段落,并以句子和片段为粒度对各段落进行启发式分割;S2、先以句子为粒度,分别抽取各段落的目标句子,得到各段落的句子摘要集合,再以所述句子摘要集合中的片段为粒度,分别抽取各段落的目标片段,得到各段落的片段摘要集合;S3、去除所述片段摘要集合中的冗余片段,将筛选出的片段按照片段出现的顺序组合,生成文本摘要。以及,基于启发式规则的文本摘要自动生成装置。采用本发明的方法生成的文本摘要的句子组织连贯性好,可读性强。
-
公开(公告)号:CN113254632B
公开(公告)日:2022-07-22
申请号:CN202110437683.7
申请日:2021-04-22
申请人: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
摘要: 本发明公开了基于事件检测技术的时间线摘要自动生成方法,包括:S10、将新闻文本集合进行聚类,得到新闻事件的子事件文档集合,每个子事件文档集合对应一个子事件;S20、获取每个子事件文档集合的摘要;S30、对所述子事件进行筛选,自动确定时间线摘要长度L′,以及对应的L′个子事件;S40、获取所述L′个子事件对应的子事件文档集合的摘要,按照日期先后顺序对所述摘要进行排序,输出带有时间戳的摘要序列。以及,基于事件检测技术的时间线摘要自动生成装置,电子设备和存储介质。本发明具有能自动确定时间线摘要的长度,灵活性强,能够处理动态变化的新闻事件等优点。
-
公开(公告)号:CN113254632A
公开(公告)日:2021-08-13
申请号:CN202110437683.7
申请日:2021-04-22
申请人: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
摘要: 本发明公开了基于事件检测技术的时间线摘要自动生成方法,包括:S10、将新闻文本集合进行聚类,得到新闻事件的子事件文档集合,每个子事件文档集合对应一个子事件;S20、获取每个子事件文档集合的摘要;S30、对所述子事件进行筛选,自动确定时间线摘要长度L′,以及对应的L′个子事件;S40、获取所述L′个子事件对应的子事件文档集合的摘要,按照日期先后顺序对所述摘要进行排序,输出带有时间戳的摘要序列。以及,基于事件检测技术的时间线摘要自动生成装置,电子设备和存储介质。本发明具有能自动确定时间线摘要的长度,灵活性强,能够处理动态变化的新闻事件等优点。
-
公开(公告)号:CN109977219A
公开(公告)日:2019-07-05
申请号:CN201910207415.9
申请日:2019-03-19
申请人: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
摘要: 本发明公开了基于启发式规则的文本摘要自动生成方法,包括:S1、以文本的段落、句子顺序作为启发式语序,将新闻正文分为开始段落、中间段落和结尾段落,并以句子和片段为粒度对各段落进行启发式分割;S2、先以句子为粒度,分别抽取各段落的目标句子,得到各段落的句子摘要集合,再以所述句子摘要集合中的片段为粒度,分别抽取各段落的目标片段,得到各段落的片段摘要集合;S3、去除所述片段摘要集合中的冗余片段,将筛选出的片段按照片段出现的顺序组合,生成文本摘要。以及,基于启发式规则的文本摘要自动生成装置。采用本发明的方法生成的文本摘要的句子组织连贯性好,可读性强。
-
公开(公告)号:CN113761337B
公开(公告)日:2023-10-27
申请号:CN202011643504.7
申请日:2020-12-31
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/9535 , G06F16/9537 , G06Q10/04
摘要: 本发明提供一种基于事件隐式要素与显式联系的事件预测方法和装置,其中,方法包括:获取事件文本中的多个事件的事件要素;提取跨事件的事件要素之间的第一关系特征,所述第一关系特征用于表征跨事件的事件要素之间的语义联系特征;基于所述第一关系特征进行事件预测。在对事件进行预测时,加入跨事件的事件要素之间的第一关系特征,可以记录跨事件的事件要素之间的隐式联系,并且通过不同事件中的事件要素语义联系特征让不同的事件之间产生了联系,挖掘出了事件元组更深层次且更具有预测性的语义信息,不仅可以提升了事件预测的准确性,而且广泛适用于基于事件要素进行事件预测的方法中,通用性强。
-
公开(公告)号:CN108829722B
公开(公告)日:2020-10-02
申请号:CN201810432079.3
申请日:2018-05-08
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06F16/36 , G06F40/295
摘要: 本发明涉及一种远程监督的Dual‑Attention关系分类方法及系统,包括:通过远程监督将知识库中的实体对对齐到新闻语料,构建实体对句子集合;基于词级别注意力机制的Bi‑LSTM模型将所述句子进行词级别的向量编码,得到所述句子的语义特征编码向量;基于句子级别注意力机制的Bi‑LSTM模型将所述句子的语义特征进行编码与去噪,得到句子集特征编码向量;将所述句子集特征编码向量与实体对翻译向量进行打包,对得到的包特征进行实体对的关系分类。本发明提供的技术方案降低了模型训练的噪声数据,避免人工标注数据及其造成的错误传递。运用开放域文本与大规模知识库进行实体对齐,有效解决了关系抽取的标注数据规模问题。
-
公开(公告)号:CN108829722A
公开(公告)日:2018-11-16
申请号:CN201810432079.3
申请日:2018-05-08
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明涉及一种远程监督的Dual-Attention关系分类方法及系统,包括:通过远程监督将知识库中的实体对对齐到新闻语料,构建实体对句子集合;基于词级别注意力机制的Bi-LSTM模型将所述句子进行词级别的向量编码,得到所述句子的语义特征编码向量;基于句子级别注意力机制的Bi-LSTM模型将所述句子的语义特征进行编码与去噪,得到句子集特征编码向量;将所述句子集特征编码向量与实体对翻译向量进行打包,对得到的包特征进行实体对的关系分类。本发明提供的技术方案降低了模型训练的噪声数据,避免人工标注数据及其造成的错误传递。运用开放域文本与大规模知识库进行实体对齐,有效解决了关系抽取的标注数据规模问题。
-
公开(公告)号:CN108052576A
公开(公告)日:2018-05-18
申请号:CN201711293661.8
申请日:2017-12-08
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明涉及一种事理知识图谱构建方法及系统,该构建系统包括:宏观事件层构建模块、微观知识层构建模块、关系映射模块、本体层构建模块和事理知识图谱生成模块;所述宏观事件层构建模块包括:事件实体抽取单元、事件演化单元和因果关系抽取单元;所述微观知识层构建模块包括:微观实体抽取单元。本发明通过从结构化数据中获取事件实体和微观实体,分别构建宏观事件层和微观实体层,并抽取不同事件实体之间的因果关系映射到微观实体中,通过对微观实体层中微观实体的关系、类型和因果关系进行抽象和归纳,由此判断事件形成突发性群体响应的本质原因,对突发事件进行预警预测。
-
公开(公告)号:CN113743111B
公开(公告)日:2024-06-04
申请号:CN202010865079.X
申请日:2020-08-25
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F40/289 , G06F40/30 , G06F18/2415 , G06F18/2431 , G06N3/045 , G06N3/084 , G06Q40/03
摘要: 本申请涉及一种基于文本预训练和多任务学习的金融风险预测方法及装置。该方法包括:获取待处理文本;将待处理文本输入第一神经网络模型,以按照风险识别任务的处理流程确定待处理文本的内容是否包括金融风险;在待处理文本的内容包括金融风险的情况下,利用第一神经网络模型按照风险分类任务的处理流程确定金融风险的风险类型;利用第一神经网络模型按照风险主体识别任务的处理流程确定与风险类型匹配的风险主体。本申请通过预训练语言模型技术解决了缺乏对语义的深度挖掘导致模型性能不佳的问题,并采用多任务处理,解决了数据量有限而且任务之间无法进行信息共享导致模型性能不佳的技术问题。
-
公开(公告)号:CN113743111A
公开(公告)日:2021-12-03
申请号:CN202010865079.X
申请日:2020-08-25
申请人: 国家计算机网络与信息安全管理中心
摘要: 本申请涉及一种基于文本预训练和多任务学习的金融风险预测方法及装置。该方法包括:获取待处理文本;将待处理文本输入第一神经网络模型,以按照风险识别任务的处理流程确定待处理文本的内容是否包括金融风险;在待处理文本的内容包括金融风险的情况下,利用第一神经网络模型按照风险分类任务的处理流程确定金融风险的风险类型;利用第一神经网络模型按照风险主体识别任务的处理流程确定与风险类型匹配的风险主体。本申请通过预训练语言模型技术解决了缺乏对语义的深度挖掘导致模型性能不佳的问题,并采用多任务处理,解决了数据量有限而且任务之间无法进行信息共享导致模型性能不佳的技术问题。
-
-
-
-
-
-
-
-
-