- 专利标题: 一种基于引用关系的科技文献高关注度句子提取方法
-
申请号: CN201810847079.X申请日: 2018-07-27
-
公开(公告)号: CN109241521B公开(公告)日: 2023-06-20
- 发明人: 陆遥 , 余丹填
- 申请人: 中山大学
- 申请人地址: 广东省广州市海珠区新港西路135号
- 专利权人: 中山大学
- 当前专利权人: 中山大学
- 当前专利权人地址: 广东省广州市海珠区新港西路135号
- 代理机构: 广州粤高专利商标代理有限公司
- 代理商 陈卫
- 主分类号: G06F40/279
- IPC分类号: G06F40/279 ; G06F16/35
摘要:
本发明涉及句子级知识抽取的技术领域,更具体地,涉及一种基于引用关系的科技文献高关注度句子提取方法。本发明的主要步骤包括:对领域文档集预处理工作、统计高被引文章、提取高关注度句子以及CNN句子分类器训练。本发明提出一种更具客观性和适用性的科技论文高关注度句子提取方法,以所要研究的某一学科领域的大量科技文献为对象,基于引文分析研究方法,统计高被引文献,从中进行相应引证句子的相似度匹配,提取出相似度高的句子组成高关注度句子集;接着,对高关注度句子进行词性标注,使用标注序列集作为训练语料,通过CNN的训练,得到能自动识别论文中创新点句子的分类器。
公开/授权文献
- CN109241521A 一种基于引用关系的科技文献高关注度句子提取方法 公开/授权日:2019-01-18