一种中文分词方法、装置及存储介质

    公开(公告)号:CN111209751B

    公开(公告)日:2023-07-28

    申请号:CN202010095159.1

    申请日:2020-02-14

    摘要: 本发明提供了一种中文分词方法、装置及存储介质,其中,方法包括:获取文本对应的每一个字的字向量;将每一个字向量输入到长短期记忆网络模型的投射层,得到投射层输出的所述字向量隶属于每一个目标类别的初始概率;获取目标领域词库对应的文本向量;将字向量隶属于每一个目标类别的初始概率和文本向量输入到长短期记忆网络模型的条件随机场层;根据文本向量,对字向量隶属于每一个目标类别的初始概率进行调整,得到标签序列;根据标签序列,得到文本的分词序列。通过实施本发明,利用长短期记忆网络模型和目标领域词库对字向量隶属于每一个目标类别的初始概率进行计算与调整,得到中文分词序列,提高了分词结果的准确性。

    用于电力信息系统的故障分类模型的训练方法及分类方法

    公开(公告)号:CN111651601A

    公开(公告)日:2020-09-11

    申请号:CN202010490481.4

    申请日:2020-06-02

    摘要: 本发明涉及故障分类技术领域,具体涉及电力信息系统的故障分类模型的训练方法及分类方法。训练方法包括获取电力信息系统的故障文本训练集;故障文本训练集中的各个故障文本带有至少一个故障分类标签;对各个故障文本进行预处理;对预处理后的各个故障文本进行文本向量化,得到向量化的故障文本;将向量化的故障文本输入故障分类模型中得到各个故障文本对应的至少一个预测分类标签,并利用各个故障文本的故障分类标签与对应的至少一个预测分类标签,对故障分类模型中的参数进行优化。各个故障文本带有至少一个故障分类标签,故障分类模型对其进行分类可以得到至少一个预测分类标签,能够在保证故障分类准确率的前提下,提高故障文本分类的效率。

    电费查询方法及电子设备
    96.
    发明公开

    公开(公告)号:CN111611370A

    公开(公告)日:2020-09-01

    申请号:CN202010455362.5

    申请日:2020-05-26

    摘要: 本发明涉及数据处理技术领域,具体涉及电费查询方法及电子设备。方法包括获取与用户意图对应的自然语言问句;利用用户意图识别模型对自然语言问句进行自然语言的理解,以确定用户意图;当确定用户意图为电费查询时,向用户推送询问用户编码的消息;获取用户反馈的答复信息;基于用户反馈的答复信息,利用对话管理模型确定向用户推送的下一个消息与用户进行对话,以向用户推送所述电费查询的结果。利用用户意图识别模型对自然语言问句进行理解确定出用户意图;利用对话管理模型确定向用户推送下一个消息,以实现向用户推送电费查询的结果。该方法不仅能够满足用户随时随地的电费查询,且能够代替人工客服处理电费查询的业务,提高电费查询的效率。

    一种中文分词方法、装置及存储介质

    公开(公告)号:CN111209751A

    公开(公告)日:2020-05-29

    申请号:CN202010095159.1

    申请日:2020-02-14

    摘要: 本发明提供了一种中文分词方法、装置及存储介质,其中,方法包括:获取文本对应的每一个字的字向量;将每一个字向量输入到长短期记忆网络模型的投射层,得到投射层输出的所述字向量隶属于每一个目标类别的初始概率;获取目标领域词库对应的文本向量;将字向量隶属于每一个目标类别的初始概率和文本向量输入到长短期记忆网络模型的条件随机场层;根据文本向量,对字向量隶属于每一个目标类别的初始概率进行调整,得到标签序列;根据标签序列,得到文本的分词序列。通过实施本发明,利用长短期记忆网络模型和目标领域词库对字向量隶属于每一个目标类别的初始概率进行计算与调整,得到中文分词序列,提高了分词结果的准确性。