一种基于词向量与词性的情感分析方法

    公开(公告)号:CN109002473B

    公开(公告)日:2022-02-11

    申请号:CN201810609313.5

    申请日:2018-06-13

    申请人: 天津大学

    摘要: 本发明公开了一种基于词向量与词性的情感分析方法,包括:获取原始微博语料库,并将原始微博语料库中的中文语料信息与语料标签信息进行匹配;去除微博文本对情感分析没有积极作用或造成干扰的特殊符号;将预处理后的文本根据词语的词性进行处理,构成原始特征集合;计算微博数据中词语的TF‑IDF值,再根据TF‑IDF提取特征词;计算词语的TF‑IDF值,将词典中每条数据都由一个词语及其对应的词向量组成;将特征词与词向量字典结合,组成特征词与词向量字典;计算每一条文本微博数据的向量,最后得到所有微博数据的向量;根据训练数据建立各自的微博数据情感分类模型,进行情感分析。

    一种基于词向量与词性的情感分析方法

    公开(公告)号:CN109002473A

    公开(公告)日:2018-12-14

    申请号:CN201810609313.5

    申请日:2018-06-13

    申请人: 天津大学

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明公开了一种基于词向量与词性的情感分析方法,包括:获取原始微博语料库,并将原始微博语料库中的中文语料信息与语料标签信息进行匹配;去除微博文本对情感分析没有积极作用或造成干扰的特殊符号;将预处理后的文本根据词语的词性进行处理,构成原始特征集合;计算微博数据中词语的TF-IDF值,再根据TF-IDF提取特征词;计算词语的TF-IDF值,将词典中每条数据都由一个词语及其对应的词向量组成;将特征词与词向量字典结合,组成特征词与词向量字典;计算每一条文本微博数据的向量,最后得到所有微博数据的向量;根据训练数据建立各自的微博数据情感分类模型,进行情感分析。

    基于用户个性化特征的微博搜索优化方法

    公开(公告)号:CN105912673A

    公开(公告)日:2016-08-31

    申请号:CN201610226690.1

    申请日:2016-04-11

    申请人: 天津大学

    IPC分类号: G06F17/30

    CPC分类号: G06F16/9535

    摘要: 一种基于用户个性化特征的微博搜索优化方法,包括:用户?词项兴趣偏好度计算,对新浪微博用户的发布、关注、转发及评论进行主题模型建模,分析用户?主题?词关系,得到用户对词语的兴趣偏好度;构建关联规则,将兴趣偏好度作为加权关联规则中各个词语的权重因子;扩充查询词语,在加权关联规则算法中,对构建关联规则后产生的带有不同权重的词项进行训练得到最终的规则,根据最终的规则表达的含义和特点对查询词进行扩充,得到扩充查询词;结合微博的时效性特征和扩充查询词与微博文档的相似性,对微博搜索结果文档进行重新评分和排序,进而优化微博搜索结果。本发明优化了微博搜索结果,针对每个用户,符合用户查询的文档排名靠前、无关文档排名靠后。