-
公开(公告)号:CN111680169A
公开(公告)日:2020-09-18
申请号:CN202010492980.7
申请日:2020-06-03
申请人: 国网内蒙古东部电力有限公司 , 国网内蒙古东部电力有限公司电力科学研究院 , 国家电网有限公司 , 中科院合肥技术创新工程院
IPC分类号: G06F16/36 , G06F16/25 , G06F16/953 , G06F40/289 , G06N3/04 , G06N3/08
摘要: 本发明涉及一种基于BERT模型技术的电力科技成果数据抽取方法,与现有技术相比解决了难以针对网络中的非结构化数据进行数据抽取的缺陷。本发明包括以下步骤:进行结构化数据的抽取;非结构化数据的抽取;非结构化数据的分析。本发明从海量电力科技成果文本数据中抽取出结构化和非结构化的电力科技成果信息,能够提高文本信息的抽取精度和速度。