发明公开
- 专利标题: 一种大规模并行政策数据知识抽取方法及系统
-
申请号: CN202011354524.2申请日: 2020-11-27
-
公开(公告)号: CN112395860A公开(公告)日: 2021-02-23
- 发明人: 李钊 , 卢凤 , 陈通 , 王瑞霜 , 胡传会 , 魏静
- 申请人: 山东省计算中心(国家超级计算济南中心) , 山东亿云信息技术有限公司
- 申请人地址: 山东省济南市历下区科院路19号
- 专利权人: 山东省计算中心(国家超级计算济南中心),山东亿云信息技术有限公司
- 当前专利权人: 山东省计算中心(国家超级计算济南中心),山东亿云信息技术有限公司
- 当前专利权人地址: 山东省济南市历下区科院路19号
- 代理机构: 济南诚智商标专利事务所有限公司
- 代理商 朱晓熹
- 主分类号: G06F40/211
- IPC分类号: G06F40/211 ; G06F40/284 ; G06F16/36 ; G06N5/02
摘要:
本发明提供了一种大规模并行政策数据知识抽取方法及系统,本发明通过对政策数据进行正文内容解析,获得政策正文数据列表,分别进行政策发文机构、发布日期知识抽取、政策申报截止日期知识抽取以及政策事件知识抽取,从而实现政策数据的知识抽取。本发明实现依存句法分析模型预加载,达到模型加载一次,多次使用的效果,提高知识抽取的效率,无需使用人工对知识进行抽取,节省人力成本,提高效率,适用于信息量巨大的网络信息获取。