摘要:
本发明提供一种基于话题多样性的文本数据观点摘要挖掘方法,其包括以下步骤:步骤S1:对话题文本进行预处理;步骤S2:输入话题语料集和背景语料集;步骤S3:提取话题语料集的话题属性;步骤S4:将得到的话题属性添加情感极性,用于对句子向量化;步骤S5:将得到的话题属性作为评价对象,采用面向多评价对象的动态词序列情感分析方法分析句子中包含的评价对象的情感极性,得出句子包含的情感属性特征,将一个句子进行特征向量化;步骤S6:利用步骤S5得到的文本句子特征向量构建多样性目标函数。能够高效准确地得到话题文本的观点摘要,并且能够应用于更大规模数据集应用场景。
公开/授权文献
- CN108268668B 一种基于话题多样性的文本数据观点摘要挖掘方法 公开/授权日:2022-01-18