-
公开(公告)号:CN111241838B
公开(公告)日:2023-10-31
申请号:CN202010043055.6
申请日:2020-01-15
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/295 , G06F40/30
摘要: 本申请提出了一种文本实体的语义关系处理方法、装置及设备,涉及知识图谱技术领域,具体实现方案为:获取包含目标实体对的多个目标文本;根据预先训练的实体关系提取模型对目标实体对和每个目标文本进行处理,获取与每个目标文本对应的目标实体对的关系向量;根据与每个目标文本对应的目标实体对的关系向量,计算目标实体对在不同目标文本之间的相似度距离;根据目标实体对在不同目标文本之间的相似度距离,确定目标实体对在不同目标文本之间的语义关系相似度。由此,能够精准确定目标实体对在不同目标文本之间的语义关系是否相似,提高了文本语义关系相似度计算的准确性。
-
公开(公告)号:CN111506623A
公开(公告)日:2020-08-07
申请号:CN202010268590.1
申请日:2020-04-08
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/2458 , G06F16/28 , G06F16/36
摘要: 本申请实施例公开了数据扩充方法、装置、设备以及存储介质,涉及知识图谱技术领域。该方法的一具体实施方式包括:从知识图谱中获取三元组;从知识图谱中挖掘与三元组中的关系等价的关系路径,其中,关系路径以三元组中的主体和客体分别为起终点;基于关系路径对三元组进行扩展,生成扩展三元组。该实施方式实现了对知识图谱中的三元组的扩展,增强了三元组中的主体与客体在更大的语境下的关联,使得三元组中的主体与客体之间的关联更加全局。
-
公开(公告)号:CN111241242A
公开(公告)日:2020-06-05
申请号:CN202010023642.9
申请日:2020-01-09
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/33 , G06F40/211 , G06F40/279 , G06F40/30
摘要: 本申请公开了一种目标内容的确定方法、装置、设备及计算机可读存储介质,包括:将根据检索信息确定的文章段落拆分为多个句子,并根据句子的属性确定句子间的关系;根据句子间的关系确定每个句子对应的句子表示;根据句子的句子表示、检索信息确定目标句子,并根据目标句子确定目标内容。本公开提供的方法、装置、设备及计算机可读存储介质中,可以确定句子的关系,并根据句子间的关系重新确定句子的句子表示,再根据句子表示在句子中确定目标句子,使得本公开提供的方法、装置、设备及计算机可读存储介质能够结合句子间关系对每句话进行分析,从而确定与检索信息更加匹配的目标内容。
-
公开(公告)号:CN111506623B
公开(公告)日:2024-03-22
申请号:CN202010268590.1
申请日:2020-04-08
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/2458 , G06F16/28 , G06F16/36
摘要: 本申请实施例公开了数据扩充方法、装置、设备以及存储介质,涉及知识图谱技术领域。该方法的一具体实施方式包括:从知识图谱中获取三元组;从知识图谱中挖掘与三元组中的关系等价的关系路径,其中,关系路径以三元组中的主体和客体分别为起终点;基于关系路径对三元组进行扩展,生成扩展三元组。该实施方式实现了对知识图谱中的三元组的扩展,增强了三元组中的主体与客体在更大的语境下的关联,使得三元组中的主体与客体之间的关联更加全局。
-
公开(公告)号:CN111522944B
公开(公告)日:2023-11-14
申请号:CN202010277015.8
申请日:2020-04-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/35 , G06F40/216 , G06F40/295 , G06F40/30
摘要: 本申请公开了用于输出信息的方法、装置、设备以及存储介质,涉及知识图谱技术领域。具体实现方案为:获取输入文本集合和任务信息集合,其中,输入文本集合中的单个输入文本与任务信息集合中的单个任务信息存在对应关系;获取与输入文本集合中输入文本相关的参考文本;将单个输入文本、与上述单个输入文本相关的参考文本以及与上述单个输入文本对应的任务信息,作为单个训练样本,得到训练样本集合;利用训练样本集合对预设的语言模型进行预训练和微调,得到目标语言模型;输出目标语言模型。本实现方式可以利用与各输入文本相关的参考文本对语言模型进行预训练和微调,提高了语言模型对外部知识的利用率,提高了语言模型对文本的理解能力。
-
公开(公告)号:CN111259107B
公开(公告)日:2023-08-18
申请号:CN202010025931.2
申请日:2020-01-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/31 , G06F16/33 , G06F16/901
摘要: 本申请公开了一种行列式文本的存储方法、装置和电子设备,涉及数据处理技术领域。具体实现方案为:通过获取待存储的行列式文本,其中,待存储的行列式文本包括多个字段;获取多个字段之中的有效字段,并根据有效字段查询字段类型表以生成行列式文本数据的数据描述域;根据多个字段的内容和字段类型表确定行列式文本数据的值存储域;将数据描述域和值存储域构成行列式文本数据进行存储。该方法通过确定行列式文本数据的数据描述域和值存储域,以将数据描述域和值存储域构成行列式文本数据进行存储,提高了行列式文本数据存储的压缩率,以及数据的检索效率。
-
公开(公告)号:CN111241242B
公开(公告)日:2023-05-30
申请号:CN202010023642.9
申请日:2020-01-09
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/33 , G06F40/211 , G06F40/279 , G06F40/30
摘要: 本申请公开了一种目标内容的确定方法、装置、设备及计算机可读存储介质,包括:将根据检索信息确定的文章段落拆分为多个句子,并根据句子的属性确定句子间的关系;根据句子间的关系确定每个句子对应的句子表示;根据句子的句子表示、检索信息确定目标句子,并根据目标句子确定目标内容。本公开提供的方法、装置、设备及计算机可读存储介质中,可以确定句子的关系,并根据句子间的关系重新确定句子的句子表示,再根据句子表示在句子中确定目标句子,使得本公开提供的方法、装置、设备及计算机可读存储介质能够结合句子间关系对每句话进行分析,从而确定与检索信息更加匹配的目标内容。
-
公开(公告)号:CN110347711B
公开(公告)日:2022-02-08
申请号:CN201910633419.3
申请日:2019-07-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/2455
摘要: 本公开提供一种分碎片存储的图数据库查询方法及装置,通过将网络拓扑图的不同部分分别存储在集群内的不同存储服务器内,在第一查询请求中携带游走总步数和首个发送第一查询请求的存储服务器的地址,接收到第一查询请求的存储服务器可以在本地存储的网络拓扑图的范围内执行多步游走,在未完成全部游走之前,向首个发送第一查询请求的存储服务器返回当前游走步数和本设备的设备标识,而不发送当前的查询结果,这样可以避免针对每个游走步都产生首个发送第一查询请求的存储服务器与当前进行查询的存储服务器之间的双向数据传输,从而节约网络资源开销,降低性能损耗和网络拥堵风险,提高查询效率。本公开还提供一种电子设备和计算机可读介质。
-
公开(公告)号:CN111563385A
公开(公告)日:2020-08-21
申请号:CN202010367760.1
申请日:2020-04-30
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/30 , G06F40/205
摘要: 本申请实施例公开了语义处理方法、装置、电子设备和介质,涉及知识图谱技术领域。具体实现方案为:确定与待解析文本匹配的目标语义元素规则,且采用目标语义元素规则对待解析文本进行解析得到语义元素解析结果;采用与目标语义元素规则关联的目标结构化规则,根据语义元素解析结果生成语义树;基于语义树,对待解析文本进行语义理解。本申请实施例有效提高了对待解析文本中复杂问题的解析效率和准确度。
-
公开(公告)号:CN111522944A
公开(公告)日:2020-08-11
申请号:CN202010277015.8
申请日:2020-04-10
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/35 , G06F40/216 , G06F40/295 , G06F40/30
摘要: 本申请公开了用于输出信息的方法、装置、设备以及存储介质,涉及知识图谱技术领域。具体实现方案为:获取输入文本集合和任务信息集合,其中,输入文本集合中的单个输入文本与任务信息集合中的单个任务信息存在对应关系;获取与输入文本集合中输入文本相关的参考文本;将单个输入文本、与上述单个输入文本相关的参考文本以及与上述单个输入文本对应的任务信息,作为单个训练样本,得到训练样本集合;利用训练样本集合对预设的语言模型进行预训练和微调,得到目标语言模型;输出目标语言模型。本实现方式可以利用与各输入文本相关的参考文本对语言模型进行预训练和微调,提高了语言模型对外部知识的利用率,提高了语言模型对文本的理解能力。
-
-
-
-
-
-
-
-
-