一种实体匹配方法和装置

    公开(公告)号:CN113609304B

    公开(公告)日:2023-05-23

    申请号:CN202110818313.8

    申请日:2021-07-20

    Applicant: 广州大学

    Abstract: 本发明涉及实体匹配技术领域,公开了一种实体匹配方法和装置,所述方法包括:获取第一数据集和第二数据集,数据集包括若干条实体记录,实体记录包括若干个属性;获取第一数据集和第二数据集的笛卡尔乘积,得到第三数据集,根据实体记录中多个属性间的预设潜在关系,将第三数据集中每个实体记录进行句子组合,获得包括第二组合的第四数据集;将第四数据集中的第二组合输入到预设的Bert模型,Bert模型用于判断第二组合的两个句子否匹配并输出匹配结果。有益效果:将第三数据集中的实体记录替换为根据属性潜在关系生成的句子,可以使第二组合输入到Bert模型中的数据保留属性之间的联系,使数据集的实体记录匹配结果更加准确。

    众包知识验证环境下众包工人可靠性模型建立方法及装置

    公开(公告)号:CN111444332A

    公开(公告)日:2020-07-24

    申请号:CN202010179259.2

    申请日:2020-03-13

    Applicant: 广州大学

    Abstract: 本发明公开了众包知识验证环境下众包工人可靠性模型建立方法及装置。所述方法包括:根据预存策略,对众包用户匹配知识领域集,并向众包用户分配知识领域集中的知识,使众包用户验证知识,得到知识标签;基于强化学习算法建立众包工人可靠性模型,并通过众包工人可靠性模型计算知识标签的奖励值,以根据奖励值更新预存策略;重复执行上述操作直至预存策略的更新次数达到预设次数,根据最新的预存策略对众包用户进行资格筛选;在知识验证完成后,将验证正确的知识加入对应的知识图谱。本发明能够基于强化学习,在众包验证环境下建立众包工人可靠性模型,实现对众包工人进行资格筛选,从而提高众包知识验证的效率。

    一种实体匹配方法和装置

    公开(公告)号:CN113609304A

    公开(公告)日:2021-11-05

    申请号:CN202110818313.8

    申请日:2021-07-20

    Applicant: 广州大学

    Abstract: 本发明涉及实体匹配技术领域,公开了一种实体匹配方法和装置,所述方法包括:获取第一数据集和第二数据集,数据集包括若干条实体记录,实体记录包括若干个属性;获取第一数据集和第二数据集的笛卡尔乘积,得到第三数据集,根据实体记录中多个属性间的预设潜在关系,将第三数据集中每个实体记录进行句子组合,获得包括第二组合的第四数据集;将第四数据集中的第二组合输入到预设的Bert模型,Bert模型用于判断第二组合的两个句子否匹配并输出匹配结果。有益效果:将第三数据集中的实体记录替换为根据属性潜在关系生成的句子,可以使第二组合输入到Bert模型中的数据保留属性之间的联系,使数据集的实体记录匹配结果更加准确。

    众包知识验证环境下众包工人可靠性模型建立方法及装置

    公开(公告)号:CN111444332B

    公开(公告)日:2023-04-18

    申请号:CN202010179259.2

    申请日:2020-03-13

    Applicant: 广州大学

    Abstract: 本发明公开了众包知识验证环境下众包工人可靠性模型建立方法及装置。所述方法包括:根据预存策略,对众包用户匹配知识领域集,并向众包用户分配知识领域集中的知识,使众包用户验证知识,得到知识标签;基于强化学习算法建立众包工人可靠性模型,并通过众包工人可靠性模型计算知识标签的奖励值,以根据奖励值更新预存策略;重复执行上述操作直至预存策略的更新次数达到预设次数,根据最新的预存策略对众包用户进行资格筛选;在知识验证完成后,将验证正确的知识加入对应的知识图谱。本发明能够基于强化学习,在众包验证环境下建立众包工人可靠性模型,实现对众包工人进行资格筛选,从而提高众包知识验证的效率。

Patent Agency Ranking