-
公开(公告)号:CN108536791A
公开(公告)日:2018-09-14
申请号:CN201810278074.X
申请日:2018-03-30
申请人: 北京百度网讯科技有限公司
CPC分类号: G06N3/04
摘要: 本发明实施例提供一种基于神经网络的搜索方法、设备及存储介质,该搜索方法包括:通过获取搜索对象及与该搜索对象匹配的多个文档,根据每个文档对应的第一神经网络向量,确定每个文档的内容校验值;根据每个文档的内容校验值、搜索结果的开始位置和结束位置、开始位置对应的概率值和结束位置对应的概率值,确定每个文档中各片段对应的参考值;根据多个文档中各片段对应的参考值,确定最大参考值对应的片段为目标搜索结果。由于每个文档的内容校验值均可以反映该文档作为搜索结果时其他文档对其的支持程度,即该文档作为搜索结果可以获得其他文档的支持校验,因此,根据内容校验值所确定的目标搜索结果的可靠性较高。
-
公开(公告)号:CN107346336A
公开(公告)日:2017-11-14
申请号:CN201710515764.8
申请日:2017-06-29
申请人: 北京百度网讯科技有限公司
CPC分类号: G06F17/30702 , G06F17/3089 , H04L67/26
摘要: 本申请公开了基于人工智能的信息处理方法和装置。该方法的一具体实施方式包括:获取预设时间段内的搜索记录集合;将搜索记录集合与百科词条集合进行匹配,并根据匹配结果从百科词条集合中选取出第一兴趣点集合;将搜索记录集合与微博话题集合进行匹配,并根据匹配结果从微博话题集合中选取出第二兴趣点集合;将第一兴趣点集合和第二兴趣点集合加入到兴趣点集合中。该实施方式实现了兴趣点的准确获取,从而有助于实现富于针对性的信息推送。
-
-
公开(公告)号:CN118312598A
公开(公告)日:2024-07-09
申请号:CN202410572183.8
申请日:2023-06-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06N3/0455
摘要: 本公开提供了一种文本生成方法、文本生成模型的训练方法及装置,涉及人工智能技术领域,尤其涉及自然语言处理、深度学习、强化学习等领域。实现方案为:获取第一问题文本;将历史步骤序列文本初始化为预设值;以及基于第一问题文本,对历史步骤序列文本进行至少一次更新,以得到目标步骤序列文本,每一次更新包括:基于第一问题文本和当前的历史步骤序列文本,生成当前的步骤文本,当前的步骤文本表示第一问题的当前解答步骤;响应于当前的步骤文本不是预设的终止文本,将当前的历史步骤序列文本与当前的步骤文本进行拼接,以得到更新后的历史步骤序列文本;响应于当前的步骤文本是终止文本,将当前的历史步骤序列文本确定为目标步骤序列文本。
-
公开(公告)号:CN114416953B
公开(公告)日:2023-10-31
申请号:CN202210069222.3
申请日:2022-01-20
申请人: 北京百度网讯科技有限公司
IPC分类号: G06N5/04 , G06F16/332 , G06F16/338 , G06F16/35 , G06F16/36 , G06F40/30 , G06N3/042 , G06N3/084
摘要: 本公开提供了一种问答处理方法、问答模型的训练方法、装置、设备、介质和产品,涉及人工智能技术领域,具体为自然语言处理、深度学习、知识图谱技术领域。问答处理方法包括:获取待处理数据,其中,待处理数据包括问题数据和候选答案;对待处理数据进行通用语义理解,得到通用数据特征;基于通用数据特征,从候选问答处理模式中选择目标问答处理模式;利用目标问答处理模式处理通用数据特征,得到候选答案中针对问题数据的目标答案。
-
公开(公告)号:CN116304101A
公开(公告)日:2023-06-23
申请号:CN202310283399.8
申请日:2023-03-21
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/36 , G06F16/31 , G06F16/332 , G06N5/022 , G06N20/00
摘要: 本公开提供了一种数据处理方法、装置、电子设备和介质,涉及数据处理领域,尤其涉及文本处理和知识库领域。数据处理方法可以包括获得用于构建知识库的第一文本;基于第一文本对预先构建的检索库进行检索以获得至少一项检索结果;构建第二文本,第二文本包括第一文本和至少一项检索结果;以及基于第二文本,通过预训练的知识库构建模型来构建或更新知识库。
-
公开(公告)号:CN116226478A
公开(公告)日:2023-06-06
申请号:CN202211707355.5
申请日:2022-12-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/9032 , G06F16/901 , G06N3/08
摘要: 本公开提供了信息处理方法、模型训练方法、装置、设备及存储介质,涉及计算机技术领域,尤其涉及人工智能、自然语言处理等技术领域。具体实现方案为:获取问题描述信息;在知识库中检索问题描述信息相关的知识,得到检索结果;对问题描述信息和检索结果进行内容理解,得到待处理信息;基于待处理信息生成有向无环图,有向无环图中包括至少一个基本推理算子;基于有向无环图处理待处理信息,得到处理结果,并输出有向无环图中各基本推理算子的输入信息和输出结果。本公开实施例可以将推理过程表达和输出出来,能够便于用户了解推理过程,因此提高了认知智能的可解释性,为完善认知智能业务和其他业务提供了数据支持。
-
公开(公告)号:CN109033074B
公开(公告)日:2023-05-23
申请号:CN201810694244.2
申请日:2018-06-29
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/258 , G06F40/30
摘要: 本发明提出一种新闻摘要生成方法、装置、设备及计算机可读介质,其中,新闻摘要生成方法包括:获取所述事件类新闻中的事件要素片段,其中,所述事件要素片段包括所述事件类新闻的时间要素、地点要素、人物要素和事件内容要素中的至少一项;基于所述事件要素片段生成所述事件类新闻的摘要。本发明的技术方法基于事件新闻要素生成摘要,工作量可控,且能提高摘要的逻辑性。
-
公开(公告)号:CN115983219A
公开(公告)日:2023-04-18
申请号:CN202310094563.0
申请日:2023-01-19
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/18 , G06F18/241
摘要: 本公开提供了一种表格信息获取方法、装置、设备、介质和程序产品,涉及计算机技术领域,具体为人工智能、知识图谱和深度学习技术领域。在本公开的一些实施例中,识别电子表格中的各单元格的单元格文本;对各单元格的单元格文本进行特征提取,得到各单元格的特征向量;根据每个单元格的特征向量和每个单元格的邻居单元格的特征向量,对每个单元格的特征向量进行更新,得到每个单元格的更新后的特征向量;根据每个单元格的更新后的特征向量,对每个单元格进行分类,得到每个单元格的类型,更加合理地聚合单元格局部区域内的邻居单元格信息,提高单元格的类型识别的准确度,区别于表格相关技术中对表格物理结构的理解,能够对更多类型的表格进行表格结构与单元格类型的理解。
-
公开(公告)号:CN115510203A
公开(公告)日:2022-12-23
申请号:CN202211182795.3
申请日:2022-09-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/04
摘要: 本公开提供了一种问题答案确定方法、装置、设备、存储介质及程序产品,涉及深度学习、自然语言处理、语义识别等人工智能技术领域,可应用于知识问答、智慧城市场景。该方法包括:将待查询问题与各条候选答案拼接为各问题答案对;基于循环神经网络的循环特性,对各问题答案对的不同粒度特征在水平方向上进行预设步数的推理操作;在每步推理操作下,利用多个预设的垂直推理层分别在不同的推理侧重点下确定不同粒度特征的特征组合权重;通过最后一步的推理操作得到分别与每个问题答案对对应的候选答案特征;根据待查询问题的问题特征与各候选答案特征之间的特征相似度,确定与待查询问题匹配的目标候选答案。该方法可为复杂的问题提供更准确的答案。
-
-
-
-
-
-
-
-
-