-
公开(公告)号:CN107368613A
公开(公告)日:2017-11-21
申请号:CN201710792394.2
申请日:2017-09-05
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及文本挖掘技术领域,具体提供了一种短文本情感分析方法及装置,旨在解决如何在考虑背景信息的情况下对短文本进行情感挖掘,以提高情感挖掘准确性的技术问题。为此目的,本发明中的方法包括:获取将短文本信息输入至LSTM网络所得的向量序列,及其背景信息;依据向量序列、背景信息和预设的Attention模型,获取单词的注意力权重;依据向量序列和注意力权重,构建短文本信息对应的新的文本向量;对新的文本向量进行情感评估。同时,本发明中的装置可以执行上述方法。本发明的技术方案,通过获取与背景信息相关的注意力权重,并基于该注意力权重构建新的文本向量,结合了短文本实际内容与背景信息,从而可以更加准确地分析短文本的情感极性。
-
公开(公告)号:CN107368613B
公开(公告)日:2020-02-28
申请号:CN201710792394.2
申请日:2017-09-05
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F40/205
Abstract: 本发明涉及文本挖掘技术领域,具体提供了一种短文本情感分析方法及装置,旨在解决如何在考虑背景信息的情况下对短文本进行情感挖掘,以提高情感挖掘准确性的技术问题。为此目的,本发明中的方法包括:获取将短文本信息输入至LSTM网络所得的向量序列,及其背景信息;依据向量序列、背景信息和预设的Attention模型,获取单词的注意力权重;依据向量序列和注意力权重,构建短文本信息对应的新的文本向量;对新的文本向量进行情感评估。同时,本发明中的装置可以执行上述方法。本发明的技术方案,通过获取与背景信息相关的注意力权重,并基于该注意力权重构建新的文本向量,结合了短文本实际内容与背景信息,从而可以更加准确地分析短文本的情感极性。
-
公开(公告)号:CN110413787A
公开(公告)日:2019-11-05
申请号:CN201910687147.5
申请日:2019-07-26
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
Abstract: 本发明实施例公开了一种文本聚类方法、装置、终端和存储介质,其中,方法包括,获取媒体中的文本数据,并对文本数据进行标签分析处理,得到N个标签,根据N个标签中各个标签之间的相似度对N个标签进行聚类处理,得到M个标签集合,在检测到可视化事件时,显示M个标签集合中每一个标签集合对应的显示标识信息,通过实施上述方法,可以基于文本中标签的相似度对文本进行聚类,提升了对文本的聚类效率。
-
公开(公告)号:CN109948047A
公开(公告)日:2019-06-28
申请号:CN201910047874.5
申请日:2019-01-18
Applicant: 中国科学院自动化研究所
IPC: G06F16/9535 , G06Q50/00
Abstract: 本发明涉及信息检索领域,具体涉及一种基于转移熵的文化基因排序方法与系统及相关设备,目的在于降低计算的复杂度,并提高排序准确度。本发明的文化基因排序方法包括:针对待排序的每种文化基因,在参与该文化基因传播的所有用户中,根据预设的关联用户数量阈值,筛选出传播该文化基因的关键用户;针对每个关键用户,分别计算该关键用户的每个关联用户到该关键用户的转移熵,进而计算该关键用户的影响力值;根据关键用户的影响力值,分别计算每种文化基因的流行度值;根据每种文化基因的流行度值,分别计算每种文化基因的得分,并根据得分进行排序。本发明提供了一种对文化基因流行度自动排序的方法,降低了计算复杂度,具有较高的排序准确度。
-
公开(公告)号:CN110413787B
公开(公告)日:2023-07-21
申请号:CN201910687147.5
申请日:2019-07-26
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F16/35 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明实施例公开了一种文本聚类方法、装置、终端和存储介质,其中,方法包括,获取媒体中的文本数据,并对文本数据进行标签分析处理,得到N个标签,根据N个标签中各个标签之间的相似度对N个标签进行聚类处理,得到M个标签集合,在检测到可视化事件时,显示M个标签集合中每一个标签集合对应的显示标识信息,通过实施上述方法,可以基于文本中标签的相似度对文本进行聚类,提升了对文本的聚类效率。
-
公开(公告)号:CN109948047B
公开(公告)日:2021-09-28
申请号:CN201910047874.5
申请日:2019-01-18
Applicant: 中国科学院自动化研究所
IPC: G06F16/9535 , G06Q50/00
Abstract: 本发明涉及信息检索领域,具体涉及一种基于转移熵的文化基因排序方法与系统及相关设备,目的在于降低计算的复杂度,并提高排序准确度。本发明的文化基因排序方法包括:针对待排序的每种文化基因,在参与该文化基因传播的所有用户中,根据预设的关联用户数量阈值,筛选出传播该文化基因的关键用户;针对每个关键用户,分别计算该关键用户的每个关联用户到该关键用户的转移熵,进而计算该关键用户的影响力值;根据关键用户的影响力值,分别计算每种文化基因的流行度值;根据每种文化基因的流行度值,分别计算每种文化基因的得分,并根据得分进行排序。本发明提供了一种对文化基因流行度自动排序的方法,降低了计算复杂度,具有较高的排序准确度。
-
-
-
-
-