中文语义关系的识别方法及装置

    公开(公告)号:CN107832290A

    公开(公告)日:2018-03-23

    申请号:CN201710980063.1

    申请日:2017-10-19

    Inventor: 李长亮 马腾 程健

    Abstract: 本发明涉及自然语言处理领域,具体涉及一种中文语义关系的识别方法及装置,旨在解决中文语义关系识别准确率低的问题。为此目的,本发明中的中文语义关系识别方法,包括下述步骤:步骤1,判断预设的语义词典中是否包含待检测中文词语词对:若是则依据所述预设的语义词典确定所述待检测中文词语词对的语义关系,若否则进行步骤2;步骤2,利用所述待检测中文词语词对的词向量,获取其第一语义关系;步骤3,利用所述待检测中文词语词对的词语结构特征,获取其第二语义关系,并根据所述第二语义关系调整所述第一语义关系,得到最终的语义关系。通过本发明可以从多个维度考量词语,高效、快速、准确地识别中文词语语义关系。

    短文本情感分析方法及装置

    公开(公告)号:CN107368613A

    公开(公告)日:2017-11-21

    申请号:CN201710792394.2

    申请日:2017-09-05

    Abstract: 本发明涉及文本挖掘技术领域,具体提供了一种短文本情感分析方法及装置,旨在解决如何在考虑背景信息的情况下对短文本进行情感挖掘,以提高情感挖掘准确性的技术问题。为此目的,本发明中的方法包括:获取将短文本信息输入至LSTM网络所得的向量序列,及其背景信息;依据向量序列、背景信息和预设的Attention模型,获取单词的注意力权重;依据向量序列和注意力权重,构建短文本信息对应的新的文本向量;对新的文本向量进行情感评估。同时,本发明中的装置可以执行上述方法。本发明的技术方案,通过获取与背景信息相关的注意力权重,并基于该注意力权重构建新的文本向量,结合了短文本实际内容与背景信息,从而可以更加准确地分析短文本的情感极性。

    中文词语语义相似度的度量方法及装置

    公开(公告)号:CN107832288B

    公开(公告)日:2020-06-16

    申请号:CN201710890874.2

    申请日:2017-09-27

    Inventor: 李长亮 马腾 程健

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种中文词语语义相似度的度量方法及装置,旨在解决中文词语语义相似度度量不准确的问题。为此目的,本发明中的度量方法包括下述步骤:采用K邻近算法计算中文词语所对应初始词向量的K个近邻词向量;采用K‑means算法计算初始词向量及其K个近邻词向量的中心向量;依据初始词向量和中心向量,以及预设的迁移向量模型g,计算中文词语的迁移向量;其中,迁移向量模型g=α×m+β×p,α和β均为预设参数,m为初始词向量,p为中心向量;依据不同中文词语对应的迁移向量,计算不同中文词语的语义相似度。通过本发明提高了中文词语语义相似性计算的准确率,能够使词向量包含更多词语语义信息,提升了系统容错性。

    短文本情感分析方法及装置

    公开(公告)号:CN107368613B

    公开(公告)日:2020-02-28

    申请号:CN201710792394.2

    申请日:2017-09-05

    Abstract: 本发明涉及文本挖掘技术领域,具体提供了一种短文本情感分析方法及装置,旨在解决如何在考虑背景信息的情况下对短文本进行情感挖掘,以提高情感挖掘准确性的技术问题。为此目的,本发明中的方法包括:获取将短文本信息输入至LSTM网络所得的向量序列,及其背景信息;依据向量序列、背景信息和预设的Attention模型,获取单词的注意力权重;依据向量序列和注意力权重,构建短文本信息对应的新的文本向量;对新的文本向量进行情感评估。同时,本发明中的装置可以执行上述方法。本发明的技术方案,通过获取与背景信息相关的注意力权重,并基于该注意力权重构建新的文本向量,结合了短文本实际内容与背景信息,从而可以更加准确地分析短文本的情感极性。

    用于特定领域的人机对话理解方法与系统及相关设备

    公开(公告)号:CN108334496A

    公开(公告)日:2018-07-27

    申请号:CN201810092029.5

    申请日:2018-01-30

    Abstract: 本发明涉及人工智能领域,具体涉及一种用于特定领域的人机对话理解方法与系统及相关设备,目的在于提高对话理解的准确率。本发明人机对话系统的对话理解方法,接收用户当前输入词并将该词映射到向量空间;使用语义表示层,将历史词向量、语义标注信息、意图类别信息表示成向量;使用语义标注层获得当前词的语义标签;使用意图识别层获得当前词的意图类别。在模型训练时,引入了额外的词性信息,使用词性预测层预测下一个输入词的词性,通过对语义标注、意图识别、词性预测三个任务进行联合处理,充分利用三个任务间共享的语义信息,并使其互相提升;本发明逻辑清晰、效率高、准确率高,妥善解决了现有人机对话系统无法有效进行实时对话理解的技术问题。

    用于特定领域的人机对话理解方法与系统及相关设备

    公开(公告)号:CN108334496B

    公开(公告)日:2020-06-12

    申请号:CN201810092029.5

    申请日:2018-01-30

    Abstract: 本发明涉及人工智能领域,具体涉及一种用于特定领域的人机对话理解方法与系统及相关设备,目的在于提高对话理解的准确率。本发明人机对话系统的对话理解方法,接收用户当前输入词并将该词映射到向量空间;使用语义表示层,将历史词向量、语义标注信息、意图类别信息表示成向量;使用语义标注层获得当前词的语义标签;使用意图识别层获得当前词的意图类别。在模型训练时,引入了额外的词性信息,使用词性预测层预测下一个输入词的词性,通过对语义标注、意图识别、词性预测三个任务进行联合处理,充分利用三个任务间共享的语义信息,并使其互相提升;本发明逻辑清晰、效率高、准确率高,妥善解决了现有人机对话系统无法有效进行实时对话理解的技术问题。

    中文语义关系的识别方法及装置

    公开(公告)号:CN107832290B

    公开(公告)日:2020-02-28

    申请号:CN201710980063.1

    申请日:2017-10-19

    Inventor: 李长亮 马腾 程健

    Abstract: 本发明涉及自然语言处理领域,具体涉及一种中文语义关系的识别方法及装置,旨在解决中文语义关系识别准确率低的问题。为此目的,本发明中的中文语义关系识别方法,包括下述步骤:步骤1,判断预设的语义词典中是否包含待检测中文词语词对:若是则依据所述预设的语义词典确定所述待检测中文词语词对的语义关系,若否则进行步骤2;步骤2,利用所述待检测中文词语词对的词向量,获取其第一语义关系;步骤3,利用所述待检测中文词语词对的词语结构特征,获取其第二语义关系,并根据所述第二语义关系调整所述第一语义关系,得到最终的语义关系。通过本发明可以从多个维度考量词语,高效、快速、准确地识别中文词语语义关系。

    多项选择题解答方法及装置

    公开(公告)号:CN108304451A

    公开(公告)日:2018-07-20

    申请号:CN201711331566.2

    申请日:2017-12-13

    Inventor: 李长亮 孔存良

    Abstract: 本发明涉及智能数据分析技术领域,具体提供了一种多项选择题解答方法及装置,旨在解决如何提高试题答案反馈准确率的技术问题。为此目的,本发明中方法包括下述步骤:依据待解答试题在预设题库中匹配出对应的目标试题;依据待解答试题中每个备选项的字符数,提取目标试题的字符串;计算每个备选项,以及每个备选项所对应的多个字符串之间的相似度;依据相似度确定每个备选项与目标试题中每个答案选项的对应关系;依据对应关系将目标试题中正确答案选项对应的备选项作为待解答试题的正确选项。同时,本发明中的装置可以实现上述方法。本发明的技术方案,无需用户进一步理解和分析,即可依据字符串之间的相似度,直接得出待解答试题的正确选项。

    中文词语语义相似度的度量方法及装置

    公开(公告)号:CN107832288A

    公开(公告)日:2018-03-23

    申请号:CN201710890874.2

    申请日:2017-09-27

    Inventor: 李长亮 马腾 程健

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种中文词语语义相似度的度量方法及装置,旨在解决中文词语语义相似度度量不准确的问题。为此目的,本发明中的度量方法包括下述步骤:采用K邻近算法计算中文词语所对应初始词向量的K个近邻词向量;采用K-mean算法计算初始词向量及其K个近邻词向量的中心向量;依据初始词向量和中心向量,以及预设的迁移向量模型g,计算中文词语的迁移向量;其中,迁移向量模型g=α×m+β×p,α和β均为预设参数,m为初始词向量,p为中心向量;依据不同中文词语对应的迁移向量,计算不同中文词语的语义相似度。通过本发明提高了中文词语语义相似性计算的准确率,能够使词向量包含更多词语语义信息,提升了系统容错性。

Patent Agency Ranking