发明公开
- 专利标题: 基于句法依存的人物属性抽取方法
- 专利标题(英): A character attribute extraction method based on syntactic dependency
-
申请号: CN201910061661.8申请日: 2019-01-23
-
公开(公告)号: CN109815497A公开(公告)日: 2019-05-28
- 发明人: 占梦来 , 张磊 , 苏家琦 , 张军 , 徐晓龙 , 张棚
- 申请人: 四川易诚智讯科技有限公司 , 电子科技大学
- 申请人地址: 四川省成都市武侯区武侯新城管委会科技园武青南路51号1幢2层1号
- 专利权人: 四川易诚智讯科技有限公司,电子科技大学
- 当前专利权人: 四川易诚智讯科技有限公司,电子科技大学
- 当前专利权人地址: 四川省成都市武侯区武侯新城管委会科技园武青南路51号1幢2层1号
- 代理机构: 成都虹盛汇泉专利代理有限公司
- 代理商 王伟
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; G06F16/36
摘要:
本发明公开一种基于句法依存的人物属性抽取方法,包括:S1、文本预处理;S2属性抽取;S3、对提取出的人物和人物属性通过Stanford core NLP得到每句的句法依存分析结果;S4、对每句的句法依存分析结果通过标记人物和人物属性找到人物和人物属性之间的最短路径,保存最短路径上的词汇,得到最短路径词汇字典;同时保存主语和属性前后词窗口大小的词汇,得到词窗口词汇字典;S5、通过分别计算属性相关词字典和对最短路径词汇字典、词窗口词汇字典的Jaccard相似度,得到人物和人物属性之间是否具有从属关系;本发明的方法实现了从无结构化英文文本中抽取出人物属性信息,无需预训练模型,所提取任务属性F1系数显著提高。
公开/授权文献
- CN109815497B 基于句法依存的人物属性抽取方法 公开/授权日:2023-04-18