-
公开(公告)号:CN110297954B
公开(公告)日:2022-08-30
申请号:CN201910517893.X
申请日:2019-06-14
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/903 , G06F16/9032 , G06F16/953
摘要: 本申请提供一种答案验证处理方法、装置、设备和存储介质,其中,方法包括:根据预设的组织方式,对问题与待检测答案进行组织处理,得到搜索询问式;在搜索引擎中对所述搜索询问式进行搜索处理,得到搜索摘要;计算所述搜索摘要与所述搜索询问式的关联值,作为所述待检测答案的客观程度值。通过组织搜索询问式,将搜索询问式在多搜索引擎中进行搜索处理,在得到的搜索结果中抓取搜索摘要,通过计算搜索摘要与搜索询问式的关联度,来判断待验证答案的客观性,实现了以自动化的方式对问题的待验证答案的客观性进行校验,提高了答案校验的正确率,节省了人工成本,提高了答案校验的效率与速度。
-
公开(公告)号:CN110659312B
公开(公告)日:2022-08-23
申请号:CN201910706763.0
申请日:2019-08-01
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/2458 , G06F16/27
摘要: 本发明提供一种数据处理的方法、装置、设备和计算机存储介质,所述方法包括:对数据库所包含的节点进行分区处理,并为所得到的每个分区分配对应的执行器;接收到检索请求之后,根据数据库的数据结构,控制各执行器执行从所属节点到与所属节点相邻的下一个节点的游走,实现数据检索。本发明通过所分配的执行器分别控制相应的节点以进行数据检索,从而提高检索速度,提升检索效率。
-
公开(公告)号:CN110276403B
公开(公告)日:2022-02-18
申请号:CN201910555704.8
申请日:2019-06-25
申请人: 北京百度网讯科技有限公司
摘要: 本申请实施例公开了模型建立方法和装置。该方法的一具体实施方式包括:建立第一模型,其中,该第一模型包括输入层和共享输入层的至少两个任务层;对该第一模型进行训练,生成第二模型,其中,该第二模型包括训练后输入层和至少两个训练后任务层;将该至少两个训练后任务层中的每个训练后任务层,与训练后输入层结合,生成独立模型;对各个独立模型进行训练,以及联合训练后的独立模型,生成模型系统,其中,该模型系统中的独立模型之间的信息流转符合预设流转方式。该实施方式提供了新的模型建立方式。
-
公开(公告)号:CN113779322A
公开(公告)日:2021-12-10
申请号:CN202111064232.X
申请日:2018-08-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/901 , G06F16/903
摘要: 根据本公开的示例实施例,提供了一种用于图检索的方法、装置、设备以及计算机可读存储介质。方法包括确定图数据中的顶点的邻接顶点数(即维度),然后根据邻接顶点数来对图数据中的多个顶点进行排序。方法还包括基于多个顶点的排序来对图数据进行切分,并且使用经切分的所述图数据,执行针对所述图数据的图检索操作。本公开的实施例将图数据中的所有顶点按照维度进行排序,并且基于排序来划分这些顶点,能够在切图过程中减少被切开的边的数目,从而提高图检索的效率。
-
公开(公告)号:CN109165325B
公开(公告)日:2021-08-17
申请号:CN201810983673.1
申请日:2018-08-27
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/901 , G06F16/903
摘要: 根据本公开的示例实施例,提供了一种用于切分图数据的方法、装置、设备以及计算机可读存储介质。方法包括确定图数据中的顶点的邻接顶点数(即维度),然后根据邻接顶点数来对图数据中的多个顶点进行排序。方法还包括基于多个顶点的排序来对图数据进行切分。本公开的实施例将图数据中的所有顶点按照维度进行排序,并且基于排序来划分这些顶点,能够在切图过程中减少被切开的边的数目。
-
公开(公告)号:CN110287284B
公开(公告)日:2021-07-06
申请号:CN201910434800.7
申请日:2019-05-23
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/33 , G06F16/332 , G06F16/953 , G06F40/295 , G06F40/30
摘要: 本发明实施例提供的语义匹配方法、装置及设备,获取输入文本中的M个实体,以及各实体的特征向量;根据各实体的特征向量,获取输入文本对应的语义信息,语义信息包括第一语义信息至第N语义信息,其中,第n语义信息用于指示对M个实体进行组合得到的个片段中每个片段的语义,每个片段对应的实体个数为n;将输入文本对应的语义信息与数据库中存储的各反馈文本对应的语义信息进行匹配,确定出与输入文本的语义的关联度高的T个反馈文本;能够提高检索结果的准确性。
-
公开(公告)号:CN111259671A
公开(公告)日:2020-06-09
申请号:CN202010041592.7
申请日:2020-01-15
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F40/295 , G06F40/30 , G06F16/35 , G06F16/36 , G06K9/62
摘要: 本申请提出了一种文本实体的语义描述处理方法、装置及设备,涉及知识图谱技术领域,具体实现方案为:获取包含主实体的多个目标文本,从每个目标文本中提取描述主实体的其他相关实体;获取每个目标文本中主实体与每个相关实体对之间的子关系向量;根据每个目标文本中主实体与每个相关实体对之间的子关系向量,计算主实体在不同目标文本之间的相似度距离;根据主实体在不同目标文本之间的相似度距离确定不同目标文本对主实体描述的语义相似度。由此,通过确定不同文本对实体描述的语义相似度,实现了准确获取不同文本对于同一实体描述的相似程度。
-
公开(公告)号:CN111241108A
公开(公告)日:2020-06-05
申请号:CN202010048213.7
申请日:2020-01-16
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/22
摘要: 本申请公开了一种基于键值对KV系统的索引方法、装置、电子设备和介质,涉及索引技术领域。具体实现方案为:获取待查询键值对中的键值,其中,所述KV系统中各键值对的键值为递增整型数;将所述键值作为定长类型索引的序号,并根据所述序号确定所述待查询键值对中数值所在存储位置的地址信息;根据所述地址信息从存储空间中读取所述待查询键值对中的数值。本申请通过将获取的键值作为定长类型索引的序号,减少了系统内存的资源占用量;通过根据所述序号确定数值所在存储位置的地址信息,进而完成数值的读取,提高了数值的读取速度以及读取效率。
-
公开(公告)号:CN110427524A
公开(公告)日:2019-11-08
申请号:CN201910715581.X
申请日:2019-08-05
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/901 , G06F16/906
摘要: 本申请公开了知识图谱补全的方法、装置、电子设备及存储介质,涉及大数据技术领域。具体实现方案为:获取三元组在不同视角的视图实例;将所述不同视角的视图实例输入目标判别分类模型,获取所述三元组在所有视角上的综合分类结果;其中,所述综合分类结果用于表征所述三元组的有效性。从而可以从多个不同的视角衡量一个三元组的有效性指标,以更全面地衡量三元组的有效性。
-
公开(公告)号:CN110399466A
公开(公告)日:2019-11-01
申请号:CN201910706456.2
申请日:2019-08-01
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/33 , G06F16/332
摘要: 本实施例提供一种问答数据的筛选方法、装置、设备以及存储介质,该方法包括:根据问答系统中的问题答案对,确定问题答案对包括的问题、答案以及所述答案的来源信息,并根据问题、答案和知识图谱,确定第一信息,所述第一信息用于表示所述答案的种类是否符合预期种类,再根据问题和答案的来源信息,确定第二信息,所述第二信息用于表示所述问题答案对的数据质量的高低,最后根据第一信息和第二信息,对问题答案对进行筛选,通过对问题答案对的准确筛选,一方面减少了数据资源的浪费,另一方面提高了问答数据的准确性和交互的及时性。
-
-
-
-
-
-
-
-
-