发明公开
- 专利标题: 互联网政治外交类新闻事件抽取方法
-
申请号: CN201910937986.8申请日: 2019-09-28
-
公开(公告)号: CN110941692A公开(公告)日: 2020-03-31
- 发明人: 崔莹 , 代翔 , 孙涛 , 潘磊 , 丁洪丽
- 申请人: 西南电子技术研究所(中国电子科技集团公司第十研究所)
- 申请人地址: 四川省成都市金牛区茶店子东街48号
- 专利权人: 西南电子技术研究所(中国电子科技集团公司第十研究所)
- 当前专利权人: 西南电子技术研究所(中国电子科技集团公司第十研究所)
- 当前专利权人地址: 四川省成都市金牛区茶店子东街48号
- 代理机构: 成飞(集团)公司专利中心
- 代理商 郭纯武
- 主分类号: G06F16/31
- IPC分类号: G06F16/31 ; G06F16/33 ; G06F40/211 ; G06F40/289
摘要:
本发明公开的一种互联网政治外交类新闻事件抽取方法,旨在提供一种能够提高事件识别准确率的抽取方法,本发明通过下述技术方案予以实现:采用人工构建初始触发词集合,根据触发词集合定义事件类别,针对每类事件构建触发词表和包含触发词、事件论元角色的事件类别模板;结合文本依存句法,分析、识别和抽取政外领域事件元素。完成单文本预处理操作,并基于义原相似性计算并扩展类别事件触发词;将满足相似度的阈值的句子作为候选事件句。筛选满足事件类别模板的事件元素,提取事件句中的实体要素;再按照事件模板将事件元素填充到对应的论元角色中;筛选满足类别模板的候选事件元素;按事件模板生成事件的结构化描述文件,构建出政外领域事件库。
公开/授权文献
- CN110941692B 互联网政治外交类新闻事件抽取方法 公开/授权日:2022-07-29