- 专利标题: 一种电网设备故障报告内故障信息的快速提取方法
-
申请号: CN202011556914.8申请日: 2020-12-25
-
公开(公告)号: CN112632972B公开(公告)日: 2024-03-15
- 发明人: 陈再发 , 劳山 , 付军
- 申请人: 浙江国际海运职业技术学院
- 申请人地址: 浙江省舟山市临城新区海天大道268号
- 专利权人: 浙江国际海运职业技术学院
- 当前专利权人: 浙江国际海运职业技术学院
- 当前专利权人地址: 浙江省舟山市临城新区海天大道268号
- 代理机构: 舟山固浚专利事务所
- 代理商 王坚强
- 主分类号: G06F40/253
- IPC分类号: G06F40/253 ; G06F40/295 ; G06N3/045 ; G06N3/0442
摘要:
本发明涉及一种电网设备故障报告内故障信息的快速提取方法,解决现有模型对领域实体识别能力不足的问题。该模型使用基于Transformer的双向编码器BERT模型解决了BiLSTM上下文信息获取不足的问题,在获得全局的上下文信息的基础上,提高模型的识别精度,并使用基于迁移学习的预训练模型BERT,增强领域字词信息获取能力。而本发明在此基础上进行面向电网领域的本地微调训练,对BERT的部分Transformer层进行面向领域的重训练,在保留原始模型包含的中文句法语法信息的情况下,使得原本不适用于电网领域的通用模型能在电网故障报告文本上取得较好的结果。
公开/授权文献
- CN112632972A 一种电网设备故障报告内故障信息的快速提取方法 公开/授权日:2021-04-09