-
公开(公告)号:CN116069925A
公开(公告)日:2023-05-05
申请号:CN202210804973.5
申请日:2022-07-08
申请人: 重庆科技学院
IPC分类号: G06F16/35 , G06F16/25 , G06F16/951 , G06F40/205 , G06F40/30 , G06F18/25 , G06F18/2415
摘要: 本发明提供一种面向开放域的突发事件新闻识别方法及存储介质,面向开放域的突发事件新闻识别方法包括以下步骤:从预处理的开放域新闻数据集中筛选出标注数据集和开放数据集及将标注数据集和开放数据集混合得到开放混合数据集,得到预训练完成后的文本特征提取器,构建自适应决策边界模型作为分类模型及得到各类别突发事件的质心和最佳决策半径并根据质心和最佳决策半径设计判定函数,利用文本特征提取器、分类模型和判定函数进行实时开放新闻环境下的突发事件识别和分类。本申请将检测突发事件和分类突发事件合并在统一框架中,实现了从开放域新闻数据中自动化地检测出突发事件新闻并完成分类,提高了从海量新闻中识别突发事件的效果。
-
公开(公告)号:CN115098675A
公开(公告)日:2022-09-23
申请号:CN202210700536.9
申请日:2022-06-20
申请人: 重庆科技学院
摘要: 本发明提供一种基于多类别表格填充的情感三元组生成方法,包括如下步骤:利用联合标注框架对原始评论文本的解析与评论文本的方面词、评论观点及情感极性统一标签;利用Bert预训练语言模型提取文本信息的语义特征;利用多类别多头注意力机制学习方面词与评论观点的关联类别增强向量表示;方面词识别与评论观点检测任务的信息分区及过滤;利用情感三元组统一标记空间实现单元格分数的填充及表格结构的对称性约束与隐含性约束;利用方面词、评价观点及情感极性在统一标注空间中均为矩形框的特性,进行统一标签搜索及结构化解码;构建多功能评论文本方面词情感三元组。本发明提升了方面词识别和评论观点检测的准确率以及消除了情感三元组重叠的问题。
-