发明公开
- 专利标题: 面向电力行业的预训练语言模型建立方法、系统及介质
-
申请号: CN202310292234.7申请日: 2023-03-23
-
公开(公告)号: CN116227584A公开(公告)日: 2023-06-06
- 发明人: 吴迪 , 王晓辉 , 张颉 , 季知祥 , 杨迎春 , 李道兴 , 向思屿 , 张凌浩
- 申请人: 中国电力科学研究院有限公司 , 国网四川省电力公司电力科学研究院 , 国家电网有限公司
- 申请人地址: 北京市海淀区清河小营东路15号; ;
- 专利权人: 中国电力科学研究院有限公司,国网四川省电力公司电力科学研究院,国家电网有限公司
- 当前专利权人: 中国电力科学研究院有限公司,国网四川省电力公司电力科学研究院,国家电网有限公司
- 当前专利权人地址: 北京市海淀区清河小营东路15号; ;
- 代理机构: 北京中巡通大知识产权代理有限公司
- 代理商 孟大帅
- 主分类号: G06N3/096
- IPC分类号: G06N3/096 ; G06N3/045 ; G06F16/332 ; G06F16/35 ; G06F40/295 ; G06Q10/20 ; G06Q50/06
摘要:
一种面向电力行业的预训练语言模型建立方法、系统及介质,方法包括:对预先建立的预训练语言模型使用电力行业文本词典进行全词遮蔽训练,得到源模型;对源模型进行模型微调,通过知识迁移获得符合各应用任务的目标模型。本发明通过对预先建立的预训练语言模型使用电力行业文本词典进行全词遮蔽训练,得到源模型,并将源模型在具体场景任务中进行微调训练,可以实现在各种下游子任务场景中的应用,相比于通用中文BERT模型,本发明对预训练语言模型使用电力行业文本词典进行全词遮蔽训练得到的源模型,在不同任务场景中的召回率和精准度上均有较大提升,在电力自然语言处理基础能力和电网业务应用场景整体上表现出优越的迁移性能。