基于句法依存的人物属性抽取方法
摘要:
本发明公开一种基于句法依存的人物属性抽取方法,包括:S1、文本预处理;S2属性抽取;S3、对提取出的人物和人物属性通过Stanford core NLP得到每句的句法依存分析结果;S4、对每句的句法依存分析结果通过标记人物和人物属性找到人物和人物属性之间的最短路径,保存最短路径上的词汇,得到最短路径词汇字典;同时保存主语和属性前后词窗口大小的词汇,得到词窗口词汇字典;S5、通过分别计算属性相关词字典和对最短路径词汇字典、词窗口词汇字典的Jaccard相似度,得到人物和人物属性之间是否具有从属关系;本发明的方法实现了从无结构化英文文本中抽取出人物属性信息,无需预训练模型,所提取任务属性F1系数显著提高。
公开/授权文献
0/0