发明公开
- 专利标题: 一种面向电网故障案例的文本结构化方法
- 专利标题(英): Text structuring method aiming at power grid fault cases
-
申请号: CN201711325919.8申请日: 2017-12-13
-
公开(公告)号: CN107992597A公开(公告)日: 2018-05-04
- 发明人: 杨祎 , 马艳 , 白德盟 , 胡博 , 闫丹凤 , 郭诗瑶 , 辜超 , 郭志红 , 陈玉峰 , 李贞 , 朱振华 , 林颖 , 李程启 , 秦佳峰 , 郑文杰
- 申请人: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网公司
- 申请人地址: 山东省济南市望岳路2000号
- 专利权人: 国网山东省电力公司电力科学研究院,北京邮电大学,国家电网公司
- 当前专利权人: 国网山东省电力公司电力科学研究院,北京邮电大学,国家电网公司
- 当前专利权人地址: 山东省济南市望岳路2000号
- 代理机构: 济南圣达知识产权代理有限公司
- 代理商 张勇
- 主分类号: G06F17/30
- IPC分类号: G06F17/30 ; G06F17/27 ; G06Q10/00 ; G06Q50/06
摘要:
本发明公开了一种面向电网故障案例的文本结构化方法;对非结构化文本进行命名实体识别,并构建面向电网领域的实体字典来辅助实体识别和文本分词;提取属性值以及描述各属性的状态量,状态量按照类型分为数字型状态量和非数字型状态量,基于规则的方法来提取并对数字型状态量修饰属性进行匹配;将非数字型状态量进行细化,划分为基于词组形式的状态量和基于句子形式的状态量,分别提取其修饰的属性;根据识别出的属性以及对应的状态量,最终生成若干由属性和对应状态量形成的二元组,完成文本结构化。
公开/授权文献
- CN107992597B 一种面向电网故障案例的文本结构化方法 公开/授权日:2020-08-18