一种关系抽取方法、装置、设备及可读存储介质

    公开(公告)号:CN117808091A

    公开(公告)日:2024-04-02

    申请号:CN202311851383.9

    申请日:2023-12-29

    Abstract: 本申请公开了一种关系抽取方法、装置、设备及可读存储介质,涉及数据处理技术领域,该方法包括:获取目标实体对和待抽取文本;将目标实体对和待抽取文本输入关系抽取模型中,得到目标实体对的关系,关系抽取模型是基于半监督学习的方式训练得到的,关系抽取模型的训练数据集包括标注数据和未标注数据,标注数据为对应的标签的真实概率大于或等于预设阈值的训练数据,未标注数据为对应的标签的真实概率小于预设阈值的训练数据。可见,本申请中的关系抽取模型在训练时可以将训练数据区分为标注数据和未标注数据,也即在训练时可以避免训练数据中的噪声数据的干扰,提高了训练出的关系抽取模型在进行关系抽取的准确性,从而提高了关系抽取的准确度。

    一种知识图谱的实体对齐方法、装置、存储介质及设备

    公开(公告)号:CN117744778A

    公开(公告)日:2024-03-22

    申请号:CN202311825351.1

    申请日:2023-12-27

    Abstract: 本申请公开了一种知识图谱的实体对齐方法、装置、存储介质及设备,该方法包括:首先根据第一知识图谱中第一知识点实体和第二知识图谱中第二知识点实体的关键词相似度,从第二知识点实体中筛选出第一知识点实体对应的候选知识点实体,然后计算第一知识点实体与候选知识点实体的文本特征向量相似度,并将高于第一相似度阈值的相似度对应的候选知识点实体与第一知识点实体构成第一对齐实体对;接着根据第一知识点实体和候选知识点实体的图特征向量,通过拉近第一对齐实体对中实体之间的距离,获取第二对齐实体对;再将剩下的候选知识点实体与第一知识点实体输入实体对齐分类模型,预测二者是否为具有包含关系的对齐实体对,以提高对齐结果的准确性。

Patent Agency Ranking