-
公开(公告)号:CN113254601A
公开(公告)日:2021-08-13
申请号:CN202110763158.4
申请日:2021-07-06
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F16/35 , G06F16/36 , G06F16/951 , G06F40/216 , G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/18
Abstract: 本发明提供一种面向知识产权的科技资源画像构建方法、装置和存储介质,所述方法包括:获取结构化的知识产权科技资源数据;对获得的知识产权科技资源数据进行数据预处理,得到专利文本特征数据;基于专利文本特征数据得到分词向量和字符向量,将其作为原始输入文本输入双向长短时循环网络模型,并将其输出向量进一步输入至与分词词性注意力模型相结合的字符级别的注意力模型,以得到知识产权科技资源数据的实体识别结果;利用结构化的知识产权科技资源数据和实体识别结果构建实体间关系;基于得到的实体识别结果和实体间的关系,利用数据统计进行知识产权科技资源数据知识图谱的构建,并基于构建的知识图谱得到面向知识产权的科技资源画像。
-
公开(公告)号:CN113254601B
公开(公告)日:2022-06-07
申请号:CN202110763158.4
申请日:2021-07-06
Applicant: 北京邮电大学
IPC: G06F16/33 , G06F16/35 , G06F16/36 , G06F16/951 , G06F40/216 , G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/18
Abstract: 本发明提供一种面向知识产权的科技资源画像构建方法、装置和存储介质,所述方法包括:获取结构化的知识产权科技资源数据;对获得的知识产权科技资源数据进行数据预处理,得到专利文本特征数据;基于专利文本特征数据得到分词向量和字符向量,将其作为原始输入文本输入双向长短时循环网络模型,并将其输出向量进一步输入至与分词词性注意力模型相结合的字符级别的注意力模型,以得到知识产权科技资源数据的实体识别结果;利用结构化的知识产权科技资源数据和实体识别结果构建实体间关系;基于得到的实体识别结果和实体间的关系,利用数据统计进行知识产权科技资源数据知识图谱的构建,并基于构建的知识图谱得到面向知识产权的科技资源画像。
-