一种语义敏感的RDF知识图谱近似查询方法

    公开(公告)号:CN109992786B

    公开(公告)日:2022-11-25

    申请号:CN201910279900.7

    申请日:2019-04-09

    Abstract: 本发明公开了一种语义敏感的RDF知识图谱近似查询方法,该方法包括以下步骤:将类型相同的RDF知识图谱实体归为一类作为划入领域知识子图,并将其作为根节点,通过根节点向外遍历实体,根据实体与根节点周围的谓词的分布计算混合实体相似度,同时选定合适的阈值,将混合实体相似度大于阈值的划入子图;利用TransE方法训练各个子图,获得子图谓词之间的语义相似度;将谓词相似度作为RDF知识图谱实体之间边的权重,并通过语义敏感的路径探查方法进行Top‑K近似查询,获取语义近似的路径和实体结果。本发明利用子图划分,克服了大规模知识图谱语义相似度时间复杂度高的问题,利用语义敏感的路径探查方法加快查询的收敛速度。

    一种语义敏感的RDF知识图谱近似查询方法

    公开(公告)号:CN109992786A

    公开(公告)日:2019-07-09

    申请号:CN201910279900.7

    申请日:2019-04-09

    Abstract: 本发明公开了一种语义敏感的RDF知识图谱近似查询方法,该方法包括以下步骤:将类型相同的RDF知识图谱实体归为一类作为划入领域知识子图,并将其作为根节点,通过根节点向外遍历实体,根据实体与根节点周围的谓词的分布计算混合实体相似度,同时选定合适的阈值,将混合实体相似度大于阈值的划入子图;利用TransE方法训练各个子图,获得子图谓词之间的语义相似度;将谓词相似度作为RDF知识图谱实体之间边的权重,并通过语义敏感的路径探查方法进行Top‑K近似查询,获取语义近似的路径和实体结果。本发明利用子图划分,克服了大规模知识图谱语义相似度时间复杂度高的问题,利用语义敏感的路径探查方法加快查询的收敛速度。

    一种基于CBOW模型和依存句法关系的词向量表示方法

    公开(公告)号:CN109992787B

    公开(公告)日:2023-04-07

    申请号:CN201910279906.4

    申请日:2019-04-09

    Abstract: 本发明公开了一种基于CBOW模型和依存句法关系的词向量表示方法。本发明首先将原始语料进行裁剪分句获得语料集合C1;针对语料集合C1进行分词及词性标注,获得语料集合C2,以及带有依存句法关系的语料集合C3;然后将语料集合C2作为CBOW模型的输入,在词向量训练过程中,通过判断中心词的词性是否为动词或名词或副词,若是则通过语料集合C3获得中心词的依存句法关系,将依存句法关系中构成强依存关系的词作为中心词的上下文,修改模型训练时的概率模型,不是则采用原有的随机窗口构造上下文。本发明综合考虑了词的词性以及依存句法信息,使得中心词具有句法上下文信息,以此来改进COBW模型的训练,从而提高词向量的表示。

    一种基于CBOW模型和依存句法关系的词向量表示方法

    公开(公告)号:CN109992787A

    公开(公告)日:2019-07-09

    申请号:CN201910279906.4

    申请日:2019-04-09

    Abstract: 本发明公开了一种基于CBOW模型和依存句法关系的词向量表示方法。本发明首先将原始语料进行裁剪分句获得语料集合C1;针对语料集合C1进行分词及词性标注,获得语料集合C2,以及带有依存句法关系的语料集合C3;然后将语料集合C2作为CBOW模型的输入,在词向量训练过程中,通过判断中心词的词性是否为动词或名词或副词,若是则通过语料集合C3获得中心词的依存句法关系,将依存句法关系中构成强依存关系的词作为中心词的上下文,修改模型训练时的概率模型,不是则采用原有的随机窗口构造上下文。本发明综合考虑了词的词性以及依存句法信息,使得中心词具有句法上下文信息,以此来改进COBW模型的训练,从而提高词向量的表示。

    一种基于分层可导航小世界图的近似最近邻搜索方法

    公开(公告)号:CN110008256A

    公开(公告)日:2019-07-12

    申请号:CN201910279860.6

    申请日:2019-04-09

    Abstract: 本发明公开了一种基于分层可导航小世界图的近似最近邻搜索方法。本发明包括以下步骤:步骤一B-HNSW索引生成方法,包括构建和遍历结点集合P,在B-HNSW索引的相应层中插入每一个结点,保存B-HNSW索引为二进制文件。步骤二B-HNSW索引近似最近邻搜索方法,包括输入目标结点,从B-HNSW索引的最大层到第1层依次查找1个与目标结点的最近邻结点,并根据1层得到的最近邻结点作为入口结点,在第0层使用贪婪算法搜索得到目标结点的最近邻k个结点。本发明修改了插入新结点的方式以及分层的布局,实现更为平衡的索引结构,使查询近似最近邻结点的时间更为快速、稳定。

Patent Agency Ranking