发明公开
- 专利标题: 概念抽取方法、装置、电子设备及存储介质
-
申请号: CN202011241251.0申请日: 2020-11-09
-
公开(公告)号: CN112527977A公开(公告)日: 2021-03-19
- 发明人: 李涓子 , 王禹权 , 于济凡 , 陈凯源 , 孙凯 , 侯磊 , 张鹏 , 唐杰 , 许斌 , 孙茂松
- 申请人: 清华大学
- 申请人地址: 北京市海淀区双清路30号清华大学
- 专利权人: 清华大学
- 当前专利权人: 清华大学
- 当前专利权人地址: 北京市海淀区双清路30号清华大学
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 张睿
- 主分类号: G06F16/332
- IPC分类号: G06F16/332 ; G06F16/33 ; G06F16/36
摘要:
本发明实施例提供一种概念抽取方法、装置、电子设备及存储介质,其中,该方法包括:根据预设的词表对待提取文本进行术语抽取,获取第一候选概念列表,并根据预设的知识图谱对待提取文本进行实体链接,获取第二候选概念列表;对第一候选概念列表和第二候选概念列表中的各候选概念进行重排序,根据重排序的结果获取待提取文本的概念抽取结果;其中,待提取文本为非结构化文本。本发明实施例提供的概念抽取方法、装置、电子设备及存储介质,通过对待提取文本进行术语抽取和实体链接获取的各候选概念进行重排序,根据重排序的结果获取概念抽取结果,能在标注数据较少甚至没有标注数据的情况下,从非结构化文本中更高效、准确等抽取出概念。
公开/授权文献
- CN112527977B 概念抽取方法、装置、电子设备及存储介质 公开/授权日:2024-06-25