-
公开(公告)号:CN113254632B
公开(公告)日:2022-07-22
申请号:CN202110437683.7
申请日:2021-04-22
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了基于事件检测技术的时间线摘要自动生成方法,包括:S10、将新闻文本集合进行聚类,得到新闻事件的子事件文档集合,每个子事件文档集合对应一个子事件;S20、获取每个子事件文档集合的摘要;S30、对所述子事件进行筛选,自动确定时间线摘要长度L′,以及对应的L′个子事件;S40、获取所述L′个子事件对应的子事件文档集合的摘要,按照日期先后顺序对所述摘要进行排序,输出带有时间戳的摘要序列。以及,基于事件检测技术的时间线摘要自动生成装置,电子设备和存储介质。本发明具有能自动确定时间线摘要的长度,灵活性强,能够处理动态变化的新闻事件等优点。
-
公开(公告)号:CN113254632A
公开(公告)日:2021-08-13
申请号:CN202110437683.7
申请日:2021-04-22
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了基于事件检测技术的时间线摘要自动生成方法,包括:S10、将新闻文本集合进行聚类,得到新闻事件的子事件文档集合,每个子事件文档集合对应一个子事件;S20、获取每个子事件文档集合的摘要;S30、对所述子事件进行筛选,自动确定时间线摘要长度L′,以及对应的L′个子事件;S40、获取所述L′个子事件对应的子事件文档集合的摘要,按照日期先后顺序对所述摘要进行排序,输出带有时间戳的摘要序列。以及,基于事件检测技术的时间线摘要自动生成装置,电子设备和存储介质。本发明具有能自动确定时间线摘要的长度,灵活性强,能够处理动态变化的新闻事件等优点。
-
公开(公告)号:CN111506734A
公开(公告)日:2020-08-07
申请号:CN201910092807.5
申请日:2019-01-30
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06N5/04 , G06F40/247 , G06Q50/26
Abstract: 本申请涉及一种事件演化知识图谱构建方法、装置、设备及存储介质,该方法包括:获取新闻的中文新闻报道;从中文新闻报道中提取对应的事件要素,组合成与中文新闻报道对应的中文事件,事件要素包括:事件触发词和事件论元;基于事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。该方法可以缓解现有技术中存在的演化事件的准确度不高的问题,达到了提高演化事件的准确度的技术效果。
-
公开(公告)号:CN111506734B
公开(公告)日:2024-01-26
申请号:CN201910092807.5
申请日:2019-01-30
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本申请涉及一种事件演化知识图谱构建方法、装置、设备及存储介质,该方法包括:获取新闻的中文新闻报道;从中文新闻报道中提取对应的事件要素,组合成与中文新闻报道对应的中文事件,事件要素包括:事件触发词和事件论元;基于事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。该方法可以缓解现有技术中存在的演化事件的准确度不高的问题,达到了提高演化事件的准确度的技术效果。
-
公开(公告)号:CN113312464A
公开(公告)日:2021-08-27
申请号:CN202110589755.X
申请日:2021-05-28
Applicant: 北京航空航天大学
IPC: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/35 , G06F16/36 , G06F40/186 , G06F40/253 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明通过人工智能领域的方法,实现了一种基于对话状态追踪技术的事件抽取方法。方法整体由事件分类、序列问题生成模型和论元抽取模型三部分组成;事件分类检测输入文本是否是事件,如果文本不包含事件,则输出NULL,否则分类文本所属的事件类型;序列问题生成模型根据事件类型和已经预测的置信度高的论元结果自动生成问题;论元抽取模型将所述序列问题生成模型生成的问题和输入文本作为输入来预测论元位置,然后采用标签对齐机制将预测的论元中置信度高的论元加入训练集中。这一方法通过三部分模型,能对所有参数的预测结果和高置信度结果进行反馈;提取两个任务之间的共同信息和模式,并利用所学习到的语法和语义知识标记;并充分利用论元之间的相关性。
-
公开(公告)号:CN111325571B
公开(公告)日:2023-08-18
申请号:CN201911396009.8
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06Q30/0282 , G06F18/214 , G06F18/24 , G06F16/35
Abstract: 一种多任务学习的商品评论标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于Transformer encoder的评论源文本特征编码器;步骤三:提取代表评论源文本整体内容的[cls]标签对于的隐状态向量用于情感分类任务;步骤四:基于Transformer decoder实现多任务的评论摘要生成器模型;步骤五:训练数据并根据联合loss函数进行训练调优,并实现模型封装与装置的接口实现;本发明避免采用抽取式的方式去生成评论标签,即不需要依赖句法结构的人工的规则集不能适合多个领域场景的缺点,又能保证标签生成的高效性,即只需要输入源文本,本发明装置能够自动产生标签。
-
公开(公告)号:CN109885670A
公开(公告)日:2019-06-14
申请号:CN201910112764.2
申请日:2019-02-13
Applicant: 北京航空航天大学
IPC: G06F16/332 , G06F16/36
Abstract: 本发明提出一种面向话题文本的交互注意力编码情感分析方法,步骤1,对话题文本进行预处理;步骤2,进行话题文本编码;步骤3,话题对象与话题文本的交互式注意力机制编码;步骤4,情感分类模型训练;步骤5,情感预测,对话题对象进行情感分析,得到适应模型装置参数的最佳情感类别。
-
公开(公告)号:CN111325571A
公开(公告)日:2020-06-23
申请号:CN201911396009.8
申请日:2019-12-30
Applicant: 北京航空航天大学
Abstract: 一种多任务学习的商品评论标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于Transformer encoder的评论源文本特征编码器;步骤三:提取代表评论源文本整体内容的[cls]标签对于的隐状态向量用于情感分类任务;步骤四:基于Transformer decoder实现多任务的评论摘要生成器模型;步骤五:训练数据并根据联合loss函数进行训练调优,并实现模型封装与装置的接口实现;本发明避免采用抽取式的方式去生成评论标签,即不需要依赖句法结构的人工的规则集不能适合多个领域场景的缺点,又能保证标签生成的高效性,即只需要输入源文本,本发明装置能够自动产生标签。
-
公开(公告)号:CN111191023A
公开(公告)日:2020-05-22
申请号:CN201911395888.2
申请日:2019-12-30
Applicant: 北京航空航天大学
IPC: G06F16/34 , G06F40/205 , G06F40/30 , G06K9/62
Abstract: 一种话题标签自动生成方法、装置与系统,包括:步骤一:构建训练数据集合与数据预处理;步骤二:实现基于内容片段的内容选择机制的Transformer encoder特征编码器;步骤三:Transformer decoder的话题摘要生成器模型;步骤四:训练数据并根据交叉验证调优,并实现模型封装与装置的接口实现;本发明通过文本摘要生成技术实现话题标签的自动生成,提出了一种话题标签生成的新场景,本发明提出内容选择机制的Transformer编码并抽取重要的源文本片段,输入解码器用于文本生成,这种设计即捕捉了有效的核心语义片段,又减少了模型训练的开销。
-
公开(公告)号:CN111177366B
公开(公告)日:2023-06-27
申请号:CN201911396046.9
申请日:2019-12-30
Applicant: 北京航空航天大学
Abstract: 本发明通过深度学习的方法,构建训练数据与数据预处理;基于BERT模型预训练语言模型进行文档与查询内容编码;基于BERT模型的查询内容进行词编码;建立基于句子级别的层级结构(Hierarchical结构)模型,实现查询内容与文档关系语义建模;模型训练后封装,通过接口输出抽取式摘要五个步骤,使BERT模型学习词级别的特征向量表示,抽取代表文档的句子和查询的句子,并将上述特征导入Transformer模型进行句子级别的语义关系特征学习,结合查询模型的思想,学习查询内容与文档的关系,通过分类函数判定最终得到文本的摘要。
-
-
-
-
-
-
-
-
-