-
公开(公告)号:CN115878775B
公开(公告)日:2024-04-12
申请号:CN202211662313.4
申请日:2022-12-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/335 , G06F40/166
摘要: 本公开提供了生成跨类型对话数据的方法和装置,涉及人工智能领域,尤其涉及深度学习,自然语言处理领域,可应用智慧城市场景。具体实现方案为:获取包括不同类型对话片段的候选对话池;从候选对话池中随机选择一段对话作为起始对话,并从候选对话池中选择与起始对话的内容相似但类型不同的预定数目段候选对话;将起始对话中的最后一轮对话分别与预定数目段候选对话中每一轮对话计算语义匹配度;将语义匹配度最高的一轮对话确定为嫁接点,并将嫁接点以及嫁接点之后的对话确定为目标对话;将起始对话与目标对话拼接起来,得到跨类型对话。该实施方式能够在缺乏标注的情况下生成多种类型的跨类型对话数据。
-
公开(公告)号:CN115905497B
公开(公告)日:2024-03-19
申请号:CN202211671950.8
申请日:2022-12-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/36
摘要: 本公开提供了一种确定答复语句的方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及自然语言处理、知识图谱和智能问答等技术领域。确定答复语句的方法的具体实现方案为:响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询预定知识图谱得到的关键信息;关键信息包括查询语句中的第一关键词及查询预定知识图谱得到的与第一关键词关联的第二关键词;根据关键信息和查询语句的上下文语句调整查询语句,得到调整后查询语句;以及根据调整后查询语句查询预定知识图谱,得到与查询语句对应的答复语句。
-
公开(公告)号:CN113553410B
公开(公告)日:2023-09-22
申请号:CN202110732814.4
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/258 , G06F16/35
摘要: 本公开公开了一种长文档处理方法、处理装置、电子设备和存储介质,涉及自然语言处理、深度学习等人工智能领域。具体实现方案为:获取长文档和待搜索的目标问题,其中,长文档包括多个段落;从多个段落中确定段落标题与目标问题匹配的第一段落;根据多个段落之间的逻辑关系,从多个段落中确定与第一段落存在设定逻辑关系的第二段落;采用阅读理解模型在第一段落和第二段落中确定与目标问题对应的目标答案。由此,通过该方法基于段落之间的逻辑关系,从长文档中选择部分适当的段落采用阅读理解模型进行处理,以检索得到目标问题所需的目标答案,这样大大提高了召回率,且耗时短,进而提高了从长文档中获取有用信息的处理效率。
-
公开(公告)号:CN113553412B
公开(公告)日:2023-07-25
申请号:CN202110738564.5
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06N3/08
摘要: 本申请公开了问答处理方法、装置、电子设备和存储介质,涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能领域。实现方案为:获取用户当前输入的第一查询语句及历史查询语句;根据第一查询语句及历史查询语句,从预设的问答集中获取多个候选问题;将每个候选问题、第一查询语句和历史查询语句输入训练生成的网络模型中,以获取每个候选问题与第一查询语句及历史查询语句之间的第一匹配度;根据每个第一匹配度,从多个候选问题中抽取目标问题;从问答集中获取目标问题对应的答案。由此,在从问答集中获取多个候选问题及利用网络模型获取匹配度时,充分考虑了历史查询语句,提高了问题召回效果,进而提高了问答系统返回答案的准确性。
-
公开(公告)号:CN116244413A
公开(公告)日:2023-06-09
申请号:CN202211686566.5
申请日:2022-12-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332
摘要: 本公开提供了一种新意图确定方法、设备和存储介质,涉及自然语言处理等人工智能技术领域。具体实现方案为:通过已有场景对查询语句集合之中的查询语句进行过滤,以生成候选集合,生成候选集合之中每个查询语句对应的文本表示向量;根据候选集合之中每个查询语句对应的文本表示向量,从候选集合的查询语句之中选择高频查询语句;根据高频查询语句生成用户的新意图。由此,通过对查询语句集合进行自动化处理,即可确定出用户的新意图,实现了新意图地自动化确定,无需人工参与,降低了挖掘新意图的成本。
-
公开(公告)号:CN116227569A
公开(公告)日:2023-06-06
申请号:CN202211691458.7
申请日:2022-12-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06N3/08 , G06N3/0455 , G06N3/0475 , G06F40/20
摘要: 本公开提供了一种预训练语言模型及可解释性方法的性能评估方法及装置,涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能技术领域。包括:获取包含掩码字的第一文本、与第一文本相似的第二文本、第一文本对应的第一标签、第二文本对应的第二标签;将第一文本及第二文本输入预训练语言模型中,以基于可解释性方法,获取第一文本的第一重要性得分及第二文本中的第二重要性得分;根据第一重要性得分及第一标签,第二重要性得分及第二标签,确定可解释性方法的性能或预训练语言模型的可解释性。由此,通过不同文本的解释结果的准确性及相似文本的解释结果的一致性,全面地评估可解释性方法的性能或者预训练语言模型的可解释性。
-
公开(公告)号:CN113408636B
公开(公告)日:2023-06-06
申请号:CN202110734498.4
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/214 , G06N20/00
摘要: 本公开提供了预训练模型获取方法、装置、电子设备及存储介质,涉及自然语言处理及深度学习等人工智能领域,其中的方法可包括:在利用训练语句对预训练模型进行训练的过程中,针对其中的自注意力模块,定义句法信息对应的学习目标;根据所定义的学习目标进行预训练模型的训练。应用本公开所述方案,可提升预训练模型的性能,并可减少对于计算资源的消耗等。
-
公开(公告)号:CN116050427A
公开(公告)日:2023-05-02
申请号:CN202211742317.3
申请日:2022-12-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/30 , G06F18/214 , G06F18/25
摘要: 本公开提供了一种信息生成方法、训练方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及自然语言处理和深度学习技术领域。具体实现方案为:对查询信息进行语义理解,得到理解信息,其中,查询信息包括历史对话信息,理解信息包括对象动作和对话状态;响应于检测到辅助请求指令,根据查询信息和理解信息,得到辅助请求信息;根据查询信息、理解信息和辅助请求信息,生成对话应答信息。
-
公开(公告)号:CN115952403A
公开(公告)日:2023-04-11
申请号:CN202211687988.4
申请日:2022-12-27
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种评估对象性能的方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及自然语言处理领域。具体实现方案为:利用待评估的目标对象处理原始文本数据,得到原始文本数据中多个字符数据各自的重要性指标;根据原始文本数据中多个字符数据各自的重要性指标,确定原始文本数据中的原始证据文本;确定与原始文本数据对应的参考证据文本;以及根据原始证据文本和参考证据文本,确定目标对象的性能指标,以评估目标对象的性能。
-
公开(公告)号:CN115878775A
公开(公告)日:2023-03-31
申请号:CN202211662313.4
申请日:2022-12-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/335 , G06F40/166
摘要: 本公开提供了生成跨类型对话数据的方法和装置,涉及人工智能领域,尤其涉及深度学习,自然语言处理领域,可应用智慧城市场景。具体实现方案为:获取包括不同类型对话片段的候选对话池;从候选对话池中随机选择一段对话作为起始对话,并从候选对话池中选择与起始对话的内容相似但类型不同的预定数目段候选对话;将起始对话中的最后一轮对话分别与预定数目段候选对话中每一轮对话计算语义匹配度;将语义匹配度最高的一轮对话确定为嫁接点,并将嫁接点以及嫁接点之后的对话确定为目标对话;将起始对话与目标对话拼接起来,得到跨类型对话。该实施方式能够在缺乏标注的情况下生成多种类型的跨类型对话数据。
-
-
-
-
-
-
-
-
-