面向RDF知识库问答的查询松弛方法

    公开(公告)号:CN110569368B

    公开(公告)日:2022-11-29

    申请号:CN201910861941.7

    申请日:2019-09-12

    申请人: 南京大学

    IPC分类号: G06F16/36 G06F40/205

    摘要: 本发明公开了一种面向知识库问答的查询松弛方法,其特征在于,包括以下步骤:将无结果SPARQL语句进行分割,对查询条件进行分析,抽取待学习推理规则的谓词,组成谓词集合;针对上述步骤得到的谓词集合,获得其中每一个谓词的推理规则集合和置信度计算模型;基于上述步骤中所获得的推理规则集合,对相应的谓词进行补充,重组查询条件,查询候选结果;基于上述步骤所获得的置信度计算模型对所述候选结果打分、排序,保留部分高置信度结果作为最终结果,并输出令每条结果成立的推理规则。本发明实现了对无查询结果SPARQL语句的高效、准确的结果预测。

    一种基于外延的将名词短语映射到描述逻辑概念的方法

    公开(公告)号:CN115186671A

    公开(公告)日:2022-10-14

    申请号:CN202210530158.4

    申请日:2022-05-16

    申请人: 南京大学

    摘要: 一种基于外延的将名词短语映射到描述逻辑概念的方法,首先穷举名词短语的所有文本片段,生成文本片段到知识库中资源的映射表;然后根据名词短语的分词、词性标注与句法树,生成解析顺序;最后按解析顺序,从EL++的概念开始,用索引到的资源生成的基本概念不断细化,直到解析完全部的词,得到名词短语映射到的描述逻辑概念。本发明通过对句法树的分析,可以自动处理复杂的含有隐式关系的名词短语可以生成的高质量的描述逻辑概念。

    中文自然语言问句语义化的知识库自动问答方法

    公开(公告)号:CN105701253B

    公开(公告)日:2019-03-26

    申请号:CN201610125710.6

    申请日:2016-03-04

    申请人: 南京大学

    IPC分类号: G06F16/36 G06F16/33

    摘要: 本发明公开了一种中文自然语言问句语义化的知识库自动问答方法,包括以下步骤:对用户输入的事实型问题进行中文自然语言处理,实现分词、词性标注、命名实体识别和扩展,生成语义依存树;使用泛化模板和语义解析技术获得问句中的时间、空间、事实主体、事实客体等组成成分,然后进行语义化处理,提取问句中所有事件相关的组成元素属性及其取值,生成多个“属性—取值”对,其中待回答的元素以疑问词代替,形成复杂事实三元组集合;待回答部分所在三元组联合其他相关事实三元组形成一个带条件约束的知识库查询,到知识库中进行基于相似度计算的查询匹配,从知识库中抽取结果,得到最终答案。本发明实现了对知识库的快速准确的查询应答。

    一种领域本体构建方法及系统

    公开(公告)号:CN103218362B

    公开(公告)日:2016-12-14

    申请号:CN201210017772.7

    申请日:2012-01-19

    IPC分类号: G06F17/30

    摘要: 本发明公开一种领域本体构建方法,包括:罗列需要被目标本体描述的所有术语的名称,形成关键词集合W0;对关键词集合W0中的所有关键词进行排序,形成关键词序列S0;创建待复用的本体集合O,将从关键词序列S0中抽取的连续子序列中的所有关键词提交到本体检索系统,将检索结果中排名最高的本体添加到本体集合O;对本体集合O中的所有本体进行集合的并操作处理,形成新的本体o;本发明还提供一种领域本体构建系统。根据本发明的技术方案,提供一种面向本体检索的关键词查询的构建方法,具有良好的定义和可操作性,可取得较高的本体复用率。

    基于全局关键属性的语义网对象共指的自动消解方法

    公开(公告)号:CN103077237B

    公开(公告)日:2015-10-28

    申请号:CN201310007682.4

    申请日:2013-01-09

    申请人: 南京大学

    发明人: 胡伟 杨睿 瞿裕忠

    IPC分类号: G06F17/30

    摘要: 本发明提供一种基于全局关键属性的语义网对象共指自动消解方法,包括下列步骤:1)语义网对象样本分类,将具有相同类型和付费域名的对象样本归类在一起;2)全局关键属性识别,针对具有相同类型和付费域名的一组语义网对象样本,识别出其中共指的对象样本集合和不共指的对象样本集合,计算上述两个集合中对象样本所含数据样本中属性间的相似度,统计识别全局关键属性;3)语义网对象共指消解,给定任意一个语义网对象,基于它的类型和付费域名,重用已识别出的全局关键属性,寻找具有相似关键属性值的其它对象,实现对象共指消解。本发明能够准确高效的自动识别出语义网对象的全局关键属性,并以此为基础,实现语义网对象共指的自动消解,此外已识别的全局关键属性在今后的消解过程中可以重用。

    一种搜索方法及系统
    16.
    发明公开

    公开(公告)号:CN103425697A

    公开(公告)日:2013-12-04

    申请号:CN201210164223.2

    申请日:2012-05-24

    IPC分类号: G06F17/30

    摘要: 本发明提供一种搜索方法及系统,该方法包括:接收到查询的关键词集合后,根据预存的所有数据项分别计算每个关键词映射到每个数据字段的条件概率;根据所述关键词集合和所述所有的数据项查找出所有可行的查询转换;根据包括每条所述可行的查询转换中的所有关键词映射到对应数据字段的条件概率的预定规则,对所述可行的查询转换进行排序;按照排序后的查询转换搜索对应的数据项。本发明可以实现完全自动化并具有较高的准确率;可实现转换排序的自动演化以不断提升准确率;可增强候选转换的多样性。

    基于检索的机器阅读理解系统的实现方法及装置

    公开(公告)号:CN112445887B

    公开(公告)日:2024-05-03

    申请号:CN201910808954.8

    申请日:2019-08-29

    申请人: 南京大学

    摘要: 基于检索的机器阅读理解系统的实现方法及装置,包括文本初步检索模块、检索结果重排序模块和机器阅读理解模块,文本初步检索模块被配置为事先构造领域文档集合,提取文档集合特征,将用户提出的问题和领域文档集合中的文档计算相似度,返回相似度最高的前x个文档给检索结果重排序模块,检索结果重排序模块根据所得x个文档与问题重新计算相关性,并将相关性最高的文档传导至机器阅读理解模块,机器阅读理解模块根据问题从最相关的文档中抽取出问题对应的答案。本发明针对用户的问题找到最相关的文档,将得到的文档和用户的问题交给机器阅读理解模型,最终得到问题对应的答案,构成了一个基于检索的机器阅读理解系统,提高问题类搜索的效率。

    一种问句时间约束理解方法、计算机设备及存储介质

    公开(公告)号:CN117391064A

    公开(公告)日:2024-01-12

    申请号:CN202210783841.9

    申请日:2022-07-05

    申请人: 南京大学

    摘要: 一种问句时间约束理解方法、计算机设备及存储介质,所述方法包括问句解析步骤、时态元素标注步骤和时间约束生成步骤,问句解析步骤对问句进行解析,得到问句的分词结果、词性标注结果和命名实体列表;时态元素标注步骤标注问句中的时间、事件、时序关系信号和序数信号;时间约束生成步骤识别序数约束和时序约束;并提供了实现所述方法的计算机设备及计算机可读存储介质。本发明能够全面准确理解问句中的时序约束、序数约束、以及对时态元素的求解意图,相比现有的问句时间约束理解方法,本发明能更好的表示问句的查询意图,可应用于无标注训练数据的问句时间约束理解。

    一种结构优先的知识库问答实现方法及其系统

    公开(公告)号:CN114090782A

    公开(公告)日:2022-02-25

    申请号:CN202010857287.5

    申请日:2020-08-24

    申请人: 南京大学

    发明人: 潘笑吟 瞿裕忠

    摘要: 一种结构优先的知识库问答实现方法及其系统,包括问句结构分析和SPARQL查询结构图生成两部分,问句结构分析的技术方法对自然语言问句进行句法解析,设计并构建了实体描述图和放松查询图两种图模型;SPARQL查询结构图的生成技术从放松查询图出发,使用构建模板的方式,构建放松查询图和SPARQL查询图的查询结构映射库,然后对于待求问句,从映射库中提取模板并拼接得到待求问句对应SPARQL查询结构图的候选。本发明能生成高准确性的SPARQL查询结构图,通过使用实体链接和关系链接可以构建完整的基于知识库的问答系统。

    一种基于语义依赖的空间关系抽取方法及装置

    公开(公告)号:CN113190655A

    公开(公告)日:2021-07-30

    申请号:CN202110506597.7

    申请日:2021-05-10

    申请人: 南京大学

    摘要: 一种基于语义依赖的空间关系抽取方法及装置,构建语义依赖识别模型,从非结构化文本中抽取出空间关系元组,首先定义语义依赖类型,分别为包含触发词角色类型和不包含触发词角色类型;然后将待识别文本及预标注的空间元素输入基于深度自注意力网络的语义依赖识别模型,结合定义的语义依赖类型,得到空间元素间的所有语义依赖识别结果;最后将得到的语义依赖识别结果进行组合,输出完整的空间关系元组。本发明将空间关系抽取问题转化为语义依赖识别问题,可同时处理多种空间关系,包括包含触发词和不含触发词的空间关系;本发明可以有效表示文本中的空间语义信息,抽取出空间元素间的语义依赖,无须人工设计特征,泛化性能强,准确率高。