面向知识产权的科技资源画像构建方法、装置和存储介质

    公开(公告)号:CN113254601B

    公开(公告)日:2022-06-07

    申请号:CN202110763158.4

    申请日:2021-07-06

    Abstract: 本发明提供一种面向知识产权的科技资源画像构建方法、装置和存储介质,所述方法包括:获取结构化的知识产权科技资源数据;对获得的知识产权科技资源数据进行数据预处理,得到专利文本特征数据;基于专利文本特征数据得到分词向量和字符向量,将其作为原始输入文本输入双向长短时循环网络模型,并将其输出向量进一步输入至与分词词性注意力模型相结合的字符级别的注意力模型,以得到知识产权科技资源数据的实体识别结果;利用结构化的知识产权科技资源数据和实体识别结果构建实体间关系;基于得到的实体识别结果和实体间的关系,利用数据统计进行知识产权科技资源数据知识图谱的构建,并基于构建的知识图谱得到面向知识产权的科技资源画像。

    自然灾害舆情分析方法和装置

    公开(公告)号:CN112559844B

    公开(公告)日:2021-08-31

    申请号:CN202011494854.1

    申请日:2020-12-17

    Abstract: 本发明提供一种自然灾害舆情分析方法和装置,所述方法包括:创建爬虫实时收集自然灾害相关的社交消息数据;对收集到的数据进行社交媒体消息的属性信息与自然灾害描述信息的抽取,基于抽取结果得到各社交消息对应的自然灾害实体数据;设置自然灾害信息表和社交消息缓存表分别记录各自然灾害和各社交消息,根据所述自然灾害实体数据按照各自然灾害事件对社交消息进行聚类,以生成聚类结果,并基于聚类结果进行自然灾害舆情分析。本发明实施例的自然灾害舆情分析方法和装置,能够大大提高多源社交媒体的自然灾害舆情分析效率。

    知识表示学习方法和装置
    43.
    发明公开

    公开(公告)号:CN113204652A

    公开(公告)日:2021-08-03

    申请号:CN202110757753.7

    申请日:2021-07-05

    Abstract: 本申请提供了一种知识表示学习方法和装置,其中,该方法包括:获取负样本候选实体集合;通过对抗生成网络,以基于语义匹配的模型作为生成器,对所述负样本候选实体集合进行抽样;以基于翻译距离的模型作为判别器,对抽样结果进行判别,得到被选定的负样本三元组;将被选定的负样本三元组对应的第一个和最后一个实体的描述和关系转化为文本序列,并利用BERT的下一句预选任务将文本序列转化为二元分类问题,以实现知识表示学习。通过上述方案解决了现有的知识表示学习过程中生成的负样本质量较差,无法得到丰富的外部语义的技术问题,达到了提升负样本的质量,且在知识图生成的过程中使得文本数据得到充分利用的技术效果。

Patent Agency Ranking