-
公开(公告)号:CN116028605B
公开(公告)日:2023-11-14
申请号:CN202310003482.5
申请日:2023-01-03
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F40/126
摘要: 本公开提供了一种逻辑表达式生成方法、模型训练方法、装置及介质,涉及人工智能技术领域,尤其涉及文本数据处理、深度学习、自然语言处理和问答系统领域。实现方案为:基于问题文本、至少一个目标文档以及多个函数标签,确定第一文本序列;基于第一文本序列,获取第一编码向量;对第一编码向量和第一标签进行融合编码,获取第一融合向量;基于第一融合向量,预测第一函数标签;将第一标签更新为第一函数标签;基于更新后的第一标签,重复执行生成操作,直至预测得到第一预设函数的全部输入;以及基于第一预设函数以及第一预设函数的全部输入,确定用于解答问题文本的逻辑表达式,以基于逻辑表达式获得问题文本的答案。
-
公开(公告)号:CN115879469B
公开(公告)日:2023-10-03
申请号:CN202211737328.2
申请日:2022-12-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/289 , G06F18/214
摘要: 本公开提供了一种文本数据处理方法、模型训练方法、装置及介质,涉及人工智能技术领域,尤其涉及文本数据处理、深度学习、自然语言处理和对话系统领域。实现方案为:基于用户的输入文本,生成用于回复输入文本的原始文本;获取目标风格信息;以及基于原始文本和目标风格信息,生成与目标风格相应的目标文本。
-
公开(公告)号:CN114881170B
公开(公告)日:2023-07-14
申请号:CN202210600319.2
申请日:2022-05-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/214 , G06N3/0499 , G06N3/084
摘要: 本公开提供了一种用于对话任务的神经网络的训练方法和对话任务处理方法,涉及人工智能领域,具体涉及机器学习技术、自然语言处理技术、对话系统技术和深度学习技术。训练方法包括:确定第一样本集和第二样本集,第一样本集基于与多个领域分别对应的对话数据,第二样本集基于与目标领域对应的对话数据;执行第一阶段的训练,包括:确定至少包括第一子网络的中间神经网络;利用第一样本集中的对应的第一样本问句和第一样本真实答句进行训练;冻结第一子网络的参数;以及执行第二阶段的训练,包括:确定包括第一子网络和第二子网络的目标神经网络;以及利用第二样本集中的对应的第二样本问句和第二样本真实答句进行训练,以得到训练后的神经网络。
-
公开(公告)号:CN116028605A
公开(公告)日:2023-04-28
申请号:CN202310003482.5
申请日:2023-01-03
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F40/126
摘要: 本公开提供了一种逻辑表达式生成方法、模型训练方法、装置及介质,涉及人工智能技术领域,尤其涉及文本数据处理、深度学习、自然语言处理和问答系统领域。实现方案为:基于问题文本、至少一个目标文档以及多个函数标签,确定第一文本序列;基于第一文本序列,获取第一编码向量;对第一编码向量和第一标签进行融合编码,获取第一融合向量;基于第一融合向量,预测第一函数标签;将第一标签更新为第一函数标签;基于更新后的第一标签,重复执行生成操作,直至预测得到第一预设函数的全部输入;以及基于第一预设函数以及第一预设函数的全部输入,确定用于解答问题文本的逻辑表达式,以基于逻辑表达式获得问题文本的答案。
-
公开(公告)号:CN115905497A
公开(公告)日:2023-04-04
申请号:CN202211671950.8
申请日:2022-12-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/36
摘要: 本公开提供了一种确定答复语句的方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及自然语言处理、知识图谱和智能问答等技术领域。确定答复语句的方法的具体实现方案为:响应于根据查询语句查询预定知识图谱未得到答复语句,获取查询预定知识图谱得到的关键信息;关键信息包括查询语句中的第一关键词及查询预定知识图谱得到的与第一关键词关联的第二关键词;根据关键信息和查询语句的上下文语句调整查询语句,得到调整后查询语句;以及根据调整后查询语句查询预定知识图谱,得到与查询语句对应的答复语句。
-
公开(公告)号:CN113554180B
公开(公告)日:2022-05-31
申请号:CN202110738469.5
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种信息预测方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及深度学习、大数据处理等人工智能技术领域,具体实现方案为:接收信息预测请求;确定与信息预测请求对应的预测服务类别;确定与预测服务类别对应的模型加载方式;以及基于模型加载方式加载目标预测模型,其中,目标预测模型在加载之后执行与预测服务类别对应的目标预测服务,以根据信息预测请求预测得到结果信息。由此,在预测请求不是很频繁的应用场景中,相比于单个预测服务预加载所有模型的技术方案,本公开实施例能够在平均响应时间稍有延长的情况下,大幅降低资源消耗。并且,对复杂逻辑进行解耦,降低单个服务信息预测的复杂度,从而有效地提升研发效率。
-
公开(公告)号:CN114548110A
公开(公告)日:2022-05-27
申请号:CN202111642350.4
申请日:2021-12-29
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/30 , G06F40/211 , G06F16/332 , G06F16/33 , G06F16/338 , G10L15/16 , G10L15/22
摘要: 本公开提供了语义理解方法、装置、电子设备及存储介质,涉及人工智能技术领域中的深度学习和自然语言处理技术领域。其中方法为:获取查询语句和上文对话,根据查询语句和上文对话识别查询语句符合规则改写条件,则基于预设规则对查询语句进行改写,以生成目标查询语句,根据查询语句和上文对话识别查询语句不符合规则改写条件,则基于改写模型对查询语句进行改写,以生成目标查询语句,以及根据目标查询语句进行意图识别,以生成意图识别结果。根据查询语句选择规则改写和模型改写两种途径中的一种进行查询语句改写,适用于多种应用场景,泛化性较高,只需针对改写后的目标查询语句进行意图识别,降低了语义理解的时长,提高语义理解的效率。
-
公开(公告)号:CN114490965A
公开(公告)日:2022-05-13
申请号:CN202111590578.3
申请日:2021-12-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/335 , G06F16/338 , G06F16/903 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本公开提供了一种问题处理方法、装置、电子设备和存储介质,涉及自然语言处理、深度学习等领域。具体实现方案为:确定获取的待处理问题与至少一个参考问答对中各候选问题之间的第一相似度,确定待处理问题与至少一个参考问答对之间的第二相似度,之后根据至少一个参考问答对的第二相似度,从至少一个参考问答对中确定目标问答对,以根据目标问答对中的目标答案,回复待处理问题。由此,根据待处理问题与各参考问答对之间的相似度,来确定待处理问题所属的目标问答对,从而根据目标问答对中的目标答案,回复待处理问题,可以提升问题回复结果的准确性和可靠性。
-
公开(公告)号:CN113553415A
公开(公告)日:2021-10-26
申请号:CN202110738866.2
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/35 , G06N3/08 , G06N3/04
摘要: 本公开公开了一种问答匹配的方法、装置及电子设备,涉及人工智能领域,具体涉及自然语言识别领域。具体实现方案为:将用户问题输入问答匹配模型,获取所述用户问题对应的推荐匹配问题;根据所述推荐匹配问题获取推荐回复,并将所述推荐回复反馈给用户。本公开实施例可以实现根据用户问题获取知识库中的最佳匹配问题,并将恢复反馈给用户。本公开实施例可以避免问答匹配中的常见错误,提高问答匹配的准确率,系统的鲁棒性更好。
-
公开(公告)号:CN113408299A
公开(公告)日:2021-09-17
申请号:CN202110738680.7
申请日:2021-06-30
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种语义表示模型的训练方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习等人工智能领域。语义表示模型的训练方法包括:基于句子获得锚样本,以及,基于所述句子的句法信息,获得正样本和负样本;采用语义表示模型分别对所述锚样本、所述正样本和所述负样本进行处理,以获得锚样本语义表示、正样本语义表示和负样本语义表示;基于所述锚样本语义表示、所述正样本语义表示和所述负样本语义表示,构建对比损失函数;基于所述对比损失函数,训练所述语义表示模型。本公开可以在不修改模型结构的基础上,使得句子的语义表示包含句法信息。
-
-
-
-
-
-
-
-
-