- 专利标题: 基于改进型Transformer编码器对电力缺陷文本的实体信息抽取方法
-
申请号: CN202211044230.9申请日: 2022-08-30
-
公开(公告)号: CN115470786A公开(公告)日: 2022-12-13
- 发明人: 龙云 , 卢有飞 , 刘璐豪 , 梁雪青 , 吴任博 , 张扬 , 赵宏伟 , 陈明辉 , 张少凡 , 邹时容 , 蔡燕春 , 刘璇
- 申请人: 广东电网有限责任公司广州供电局
- 申请人地址: 广东省广州市天河区天河南二路2号
- 专利权人: 广东电网有限责任公司广州供电局
- 当前专利权人: 广东电网有限责任公司广州供电局
- 当前专利权人地址: 广东省广州市天河区天河南二路2号
- 代理机构: 广州市华学知识产权代理有限公司
- 代理商 杨望仙
- 主分类号: G06F40/289
- IPC分类号: G06F40/289 ; G06F40/242 ; G06F16/36 ; G06N3/04 ; G06N3/08
摘要:
本发明涉及于人工智能与电力系统交叉领域,为基于改进型Transformer编码器对电力缺陷文本的实体信息抽取方法。该方法通过引入预训练语言模型、词典、微调TENER模型和条件随机场模型,搭建CWG‑TENER模型,利用带标注的电力系统二次设备缺陷文本,对模型进行优化训练和测试选择,得到电力设备缺陷文本信息抽取模型,将待抽取信息的电力设备缺陷文本输入电力设备缺陷文本信息抽取模型,得到所抽取的信息。本发明可用于对电力系统二次设备缺陷文本中涉及到的实体信息进行抽取,可以在电力系统二次设备出现故障时提供辅助决策作用。