一种电网设备故障报告内故障信息的快速提取方法
摘要:
本发明涉及一种电网设备故障报告内故障信息的快速提取方法,解决现有模型对领域实体识别能力不足的问题。该模型使用基于Transformer的双向编码器BERT模型解决了BiLSTM上下文信息获取不足的问题,在获得全局的上下文信息的基础上,提高模型的识别精度,并使用基于迁移学习的预训练模型BERT,增强领域字词信息获取能力。而本发明在此基础上进行面向电网领域的本地微调训练,对BERT的部分Transformer层进行面向领域的重训练,在保留原始模型包含的中文句法语法信息的情况下,使得原本不适用于电网领域的通用模型能在电网故障报告文本上取得较好的结果。
0/0