生成跨类型对话数据的方法和装置

    公开(公告)号:CN115878775B

    公开(公告)日:2024-04-12

    申请号:CN202211662313.4

    申请日:2022-12-23

    摘要: 本公开提供了生成跨类型对话数据的方法和装置,涉及人工智能领域,尤其涉及深度学习,自然语言处理领域,可应用智慧城市场景。具体实现方案为:获取包括不同类型对话片段的候选对话池;从候选对话池中随机选择一段对话作为起始对话,并从候选对话池中选择与起始对话的内容相似但类型不同的预定数目段候选对话;将起始对话中的最后一轮对话分别与预定数目段候选对话中每一轮对话计算语义匹配度;将语义匹配度最高的一轮对话确定为嫁接点,并将嫁接点以及嫁接点之后的对话确定为目标对话;将起始对话与目标对话拼接起来,得到跨类型对话。该实施方式能够在缺乏标注的情况下生成多种类型的跨类型对话数据。

    确定答复语句的方法、装置、电子设备和存储介质

    公开(公告)号:CN115905497B

    公开(公告)日:2024-03-19

    申请号:CN202211671950.8

    申请日:2022-12-23

    摘要: 本公开提供了一种确定答复语句的方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及自然语言处理、知识图谱和智能问答等技术领域。确定答复语句的方法的具体实现方案为:响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询预定知识图谱得到的关键信息;关键信息包括查询语句中的第一关键词及查询预定知识图谱得到的与第一关键词关联的第二关键词;根据关键信息和查询语句的上下文语句调整查询语句,得到调整后查询语句;以及根据调整后查询语句查询预定知识图谱,得到与查询语句对应的答复语句。

    长文档处理方法、处理装置、电子设备和存储介质

    公开(公告)号:CN113553410B

    公开(公告)日:2023-09-22

    申请号:CN202110732814.4

    申请日:2021-06-30

    摘要: 本公开公开了一种长文档处理方法、处理装置、电子设备和存储介质,涉及自然语言处理、深度学习等人工智能领域。具体实现方案为:获取长文档和待搜索的目标问题,其中,长文档包括多个段落;从多个段落中确定段落标题与目标问题匹配的第一段落;根据多个段落之间的逻辑关系,从多个段落中确定与第一段落存在设定逻辑关系的第二段落;采用阅读理解模型在第一段落和第二段落中确定与目标问题对应的目标答案。由此,通过该方法基于段落之间的逻辑关系,从长文档中选择部分适当的段落采用阅读理解模型进行处理,以检索得到目标问题所需的目标答案,这样大大提高了召回率,且耗时短,进而提高了从长文档中获取有用信息的处理效率。

    问答处理方法、装置、电子设备和存储介质

    公开(公告)号:CN113553412B

    公开(公告)日:2023-07-25

    申请号:CN202110738564.5

    申请日:2021-06-30

    IPC分类号: G06F16/332 G06F16/33 G06N3/08

    摘要: 本申请公开了问答处理方法、装置、电子设备和存储介质,涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能领域。实现方案为:获取用户当前输入的第一查询语句及历史查询语句;根据第一查询语句及历史查询语句,从预设的问答集中获取多个候选问题;将每个候选问题、第一查询语句和历史查询语句输入训练生成的网络模型中,以获取每个候选问题与第一查询语句及历史查询语句之间的第一匹配度;根据每个第一匹配度,从多个候选问题中抽取目标问题;从问答集中获取目标问题对应的答案。由此,在从问答集中获取多个候选问题及利用网络模型获取匹配度时,充分考虑了历史查询语句,提高了问题召回效果,进而提高了问答系统返回答案的准确性。

    新意图确定方法、设备和存储介质

    公开(公告)号:CN116244413A

    公开(公告)日:2023-06-09

    申请号:CN202211686566.5

    申请日:2022-12-27

    IPC分类号: G06F16/332

    摘要: 本公开提供了一种新意图确定方法、设备和存储介质,涉及自然语言处理等人工智能技术领域。具体实现方案为:通过已有场景对查询语句集合之中的查询语句进行过滤,以生成候选集合,生成候选集合之中每个查询语句对应的文本表示向量;根据候选集合之中每个查询语句对应的文本表示向量,从候选集合的查询语句之中选择高频查询语句;根据高频查询语句生成用户的新意图。由此,通过对查询语句集合进行自动化处理,即可确定出用户的新意图,实现了新意图地自动化确定,无需人工参与,降低了挖掘新意图的成本。

    预训练语言模型及可解释性方法的性能评估方法及装置

    公开(公告)号:CN116227569A

    公开(公告)日:2023-06-06

    申请号:CN202211691458.7

    申请日:2022-12-27

    摘要: 本公开提供了一种预训练语言模型及可解释性方法的性能评估方法及装置,涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能技术领域。包括:获取包含掩码字的第一文本、与第一文本相似的第二文本、第一文本对应的第一标签、第二文本对应的第二标签;将第一文本及第二文本输入预训练语言模型中,以基于可解释性方法,获取第一文本的第一重要性得分及第二文本中的第二重要性得分;根据第一重要性得分及第一标签,第二重要性得分及第二标签,确定可解释性方法的性能或预训练语言模型的可解释性。由此,通过不同文本的解释结果的准确性及相似文本的解释结果的一致性,全面地评估可解释性方法的性能或者预训练语言模型的可解释性。

    评估对象性能的方法、装置、电子设备及存储介质

    公开(公告)号:CN115952403A

    公开(公告)日:2023-04-11

    申请号:CN202211687988.4

    申请日:2022-12-27

    IPC分类号: G06F18/21 G06N3/08

    摘要: 本公开提供了一种评估对象性能的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及自然语言处理领域。具体实现方案为:利用待评估的目标对象处理原始文本数据,得到原始文本数据中多个字符数据各自的重要性指标;根据原始文本数据中多个字符数据各自的重要性指标,确定原始文本数据中的原始证据文本;确定与原始文本数据对应的参考证据文本;以及根据原始证据文本和参考证据文本,确定目标对象的性能指标,以评估目标对象的性能。

    生成跨类型对话数据的方法和装置

    公开(公告)号:CN115878775A

    公开(公告)日:2023-03-31

    申请号:CN202211662313.4

    申请日:2022-12-23

    摘要: 本公开提供了生成跨类型对话数据的方法和装置,涉及人工智能领域,尤其涉及深度学习,自然语言处理领域,可应用智慧城市场景。具体实现方案为:获取包括不同类型对话片段的候选对话池;从候选对话池中随机选择一段对话作为起始对话,并从候选对话池中选择与起始对话的内容相似但类型不同的预定数目段候选对话;将起始对话中的最后一轮对话分别与预定数目段候选对话中每一轮对话计算语义匹配度;将语义匹配度最高的一轮对话确定为嫁接点,并将嫁接点以及嫁接点之后的对话确定为目标对话;将起始对话与目标对话拼接起来,得到跨类型对话。该实施方式能够在缺乏标注的情况下生成多种类型的跨类型对话数据。