一种通用电力非结构化数据转结构化数据方法
摘要:
本发明涉及一种通用电力非结构化数据转结构化数据方法,包括:获取非结构化数据;提取非结构化数据的文件属性为元数据;将所述非结构化数据转换为文本数据;提取文本数据中的关键信息;组合所述元数据和关键信息,得到所述非结构化数据对应的结构化数据。本发明使用元数据描述文件的属性信息,即实现了非结构化数据存储与应用的解耦,又保留了非结构化数据基于文件名称、类型等属性检索的传统应用方式;同时利用json格式存储元数据、关键信息、结构化数据,定义、规范了非结构化数据采集、处理、信息提取及结构化数据融合、存储等环节数据格式,统一了非结构化数据的描述结构,提供了电力多类别非结构化数据转换的标准化通用流程。
0/0