-
公开(公告)号:CN113204652B
公开(公告)日:2021-09-07
申请号:CN202110757753.7
申请日:2021-07-05
Applicant: 北京邮电大学
Abstract: 本申请提供了一种知识表示学习方法和装置,其中,该方法包括:获取负样本候选实体集合;通过对抗生成网络,以基于语义匹配的模型作为生成器,对所述负样本候选实体集合进行抽样;以基于翻译距离的模型作为判别器,对抽样结果进行判别,得到被选定的负样本三元组;将被选定的负样本三元组对应的第一个和最后一个实体的描述和关系转化为文本序列,并利用BERT的下一句预选任务将文本序列转化为二元分类问题,以实现知识表示学习。通过上述方案解决了现有的知识表示学习过程中生成的负样本质量较差,无法得到丰富的外部语义的技术问题,达到了提升负样本的质量,且在知识图生成的过程中使得文本数据得到充分利用的技术效果。
-
公开(公告)号:CN114840645A
公开(公告)日:2022-08-02
申请号:CN202210776673.0
申请日:2022-07-04
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F40/211 , G06F40/30 , G06K9/62 , G06N3/08
Abstract: 本申请提供一种专家学者科技资源信息的文本语义检索方法及装置,方法包括:对BERT输出的包含有专家学者科技资源信息的目标文本对应的各个句子语义特征向量和检索关键词对应的词语义特征向量进行线性变换,得到标准正交基下的文本语义向量集和关键词语义向量;基于针对专家学者科技资源信息的多维相似度计算方式,对关键词语义向量与文本语义向量集进行余弦相似度计算,以确定文本语义检索结果。本申请能够有效提高针对专家学者科技资源信息进行文本语义检索的准确性及可靠性;并能够在提高语义检索结果的有效性及可用性的基础上,满足余弦相似度所适用场景,还能够有效提高专家学者科技资源文本语义检索结果的多样性及全面性。
-
公开(公告)号:CN113204652A
公开(公告)日:2021-08-03
申请号:CN202110757753.7
申请日:2021-07-05
Applicant: 北京邮电大学
Abstract: 本申请提供了一种知识表示学习方法和装置,其中,该方法包括:获取负样本候选实体集合;通过对抗生成网络,以基于语义匹配的模型作为生成器,对所述负样本候选实体集合进行抽样;以基于翻译距离的模型作为判别器,对抽样结果进行判别,得到被选定的负样本三元组;将被选定的负样本三元组对应的第一个和最后一个实体的描述和关系转化为文本序列,并利用BERT的下一句预选任务将文本序列转化为二元分类问题,以实现知识表示学习。通过上述方案解决了现有的知识表示学习过程中生成的负样本质量较差,无法得到丰富的外部语义的技术问题,达到了提升负样本的质量,且在知识图生成的过程中使得文本数据得到充分利用的技术效果。
-
-