-
公开(公告)号:CN114996408A
公开(公告)日:2022-09-02
申请号:CN202210754571.9
申请日:2022-06-29
申请人: 国家电网有限公司大数据中心
IPC分类号: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/02
摘要: 本发明属于电力数据处理技术领域,尤其为一种基于Bert的面向非结构化电力数据的知识抽取方法及系统,该方法中,对触发词明显、句式和位置相对固定的知识,使用正则匹配方法抽取知识实体,对于非结构化电力数据中存在实体界限模糊和实体嵌套问题,通过基于Bert的知识抽取方法来抽取知识实体,然后再利用实体抽取的结果使用基于Bert的预训练语言模型进行关系和属性抽取,最终实现对非结构化电力数据的知识抽取,充分考虑了非结构化电力数据的句式和结构,适于非结构化电力数据的知识抽取,属于一种深度学习的知识抽取方法,而深度学习方法可以自动学习特征,采用低维、稠密的实值向量表示数据,避免了对人工和专家知识的严重依赖。