一种基于引用关系的科技文献高关注度句子提取方法
摘要:
本发明涉及句子级知识抽取的技术领域,更具体地,涉及一种基于引用关系的科技文献高关注度句子提取方法。本发明的主要步骤包括:对领域文档集预处理工作、统计高被引文章、提取高关注度句子以及CNN句子分类器训练。本发明提出一种更具客观性和适用性的科技论文高关注度句子提取方法,以所要研究的某一学科领域的大量科技文献为对象,基于引文分析研究方法,统计高被引文献,从中进行相应引证句子的相似度匹配,提取出相似度高的句子组成高关注度句子集;接着,对高关注度句子进行词性标注,使用标注序列集作为训练语料,通过CNN的训练,得到能自动识别论文中创新点句子的分类器。
0/0