基于双重注意力机制的方面级情感分析方法、系统及模型

    公开(公告)号:CN112861522B

    公开(公告)日:2023-12-29

    申请号:CN202110137190.1

    申请日:2021-02-01

    摘要: 本发明实施例提供一种基于双重注意力机制的方面级情感分析方法、系统及模型,属于自然语言处理技术领域。所述方法包括:获取待识别的文本;将文本映射成低维空间的连续词向量;获取前向隐藏向量和后向隐藏向量;拼接前向隐藏向量和后向隐藏向量以得到隐藏向量;获取隐藏向量的外部注意力权重;获取隐藏向量的内部注意力权重;根据外部注意力权重和内部注意力权重得到综合注意力权重;确定第一向量;从第一向量中选择综合注意力权重较大向量以得到第二向量;对第二向量执行卷积运算得到第三向量;从第三向量中选择值最大的向量以得到第四向量;采用softmax函数计算文本被分类至每个类别的概率;选择概率最大的类别作为文本的分类结果。

    基于多粒度建模的半监督文本分类方法和系统

    公开(公告)号:CN112214597B

    公开(公告)日:2022-09-06

    申请号:CN202011004053.2

    申请日:2020-09-22

    IPC分类号: G06F16/35 G06N3/08

    摘要: 本发明提供一种基于多粒度建模的半监督文本分类方法和系统,涉及数据处理技术和机器学习技术领域。本发明使用多粒度的文本建模方式形成三通道的文本向量模型层,分别从字符级、词语级、句子级三个级别对同一文本进行文本建模,再将三个级别的建模分别作为三个通道,并将三个通道的输出输入给三个基分类器组,在不损失样本或者特征的情况下获得样本之间的分歧,取代了传统的重采样与随机子空间方法;同时,九个基分类器集成为三个基分类器组的设计,集成了不同基分类器的优点,使用不同的基分类器获取相同样本的不同特征,获得基分类器之间的分歧,从而有效提高了半监督文本分类方法的分类结果准确度。

    基于多层次特征提取的文本分类方法、模型及存储介质

    公开(公告)号:CN112559680B

    公开(公告)日:2022-10-04

    申请号:CN202011384063.3

    申请日:2020-12-01

    摘要: 本发明实施方式提供一种基于多层次特征提取的文本分类方法、模型及存储介质,属于自然语言处理技术。所述文本分类方法包括:将输入文本进行词嵌入操作以获得所述输入文本的词嵌入矩阵;获取所述词嵌入矩阵的上下文语义信息;对所述上下文语义信息给予不同的关注以得到全局特征;基于所述全局特征进行高层次特征提取以得到对应的高层次特征表示;根据所述高层次特征表示确定所述输入文本被分类至各个类别的分类概率;根据所述分类概率确定所述输入文本的分类结果。该文本分类方法能够通过提取深层次的局部语义信息,从而实现文本的准确分类。

    基于多层次特征提取的文本分类方法、模型及存储介质

    公开(公告)号:CN112559680A

    公开(公告)日:2021-03-26

    申请号:CN202011384063.3

    申请日:2020-12-01

    摘要: 本发明实施方式提供一种基于多层次特征提取的文本分类方法、模型及存储介质,属于自然语言处理技术。所述文本分类方法包括:将输入文本进行词嵌入操作以获得所述输入文本的词嵌入矩阵;获取所述词嵌入矩阵的上下文语义信息;对所述上下文语义信息给予不同的关注以得到全局特征;基于所述全局特征进行高层次特征提取以得到对应的高层次特征表示;根据所述高层特征表示确定所述输入文本被分类至各个类别的分类概率;根据所述分类概率确定所述输入文本的分类结果。该文本分类方法能够通过提取深层次的局部语义信息,从而实现文本的准确分类。

    基于双重注意力机制的方面级情感分析方法、系统及模型

    公开(公告)号:CN112861522A

    公开(公告)日:2021-05-28

    申请号:CN202110137190.1

    申请日:2021-02-01

    摘要: 本发明实施例提供一种基于双重注意力机制的方面级情感分析方法、系统及模型,属于自然语言处理技术领域。所述方法包括:获取待识别的文本;将文本映射成低维空间的连续词向量;获取前向隐藏向量和后向隐藏向量;拼接前向隐藏向量和后向隐藏向量以得到隐藏向量;获取隐藏向量的外部注意力权重;获取隐藏向量的内部注意力权重;根据外部注意力权重和内部注意力权重得到综合注意力权重;确定第一向量;从第一向量中选择综合注意力权重较大向量以得到第二向量;对第二向量执行卷积运算得到第三向量;从第三向量中选择值最大的向量以得到第四向量;采用softmax函数计算文本被分类至每个类别的概率;选择概率最大的类别作为文本的分类结果。

    基于多粒度建模的半监督文本分类方法和系统

    公开(公告)号:CN112214597A

    公开(公告)日:2021-01-12

    申请号:CN202011004053.2

    申请日:2020-09-22

    IPC分类号: G06F16/35 G06N3/08

    摘要: 本发明提供一种基于多粒度建模的半监督文本分类方法和系统,涉及数据处理技术和机器学习技术领域。本发明使用多粒度的文本建模方式形成三通道的文本向量模型层,分别从字符级、词语级、句子级三个级别对同一文本进行文本建模,再将三个级别的建模分别作为三个通道,并将三个通道的输出输入给三个基分类器组,在不损失样本或者特征的情况下获得样本之间的分歧,取代了传统的重采样与随机子空间方法;同时,九个基分类器集成为三个基分类器组的设计,集成了不同基分类器的优点,使用不同的基分类器获取相同样本的不同特征,获得基分类器之间的分歧,从而有效提高了半监督文本分类方法的分类结果准确度。