发明公开
- 专利标题: 一种通用电力非结构化数据转结构化数据方法
-
申请号: CN202211667014.X申请日: 2022-12-22
-
公开(公告)号: CN115757596A公开(公告)日: 2023-03-07
- 发明人: 伍臣周 , 李强 , 庄莉 , 赵峰 , 王秋琳 , 宋立华
- 申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司
- 申请人地址: 福建省福州市鼓楼区软件大道89号G区20号楼;
- 专利权人: 福建亿榕信息技术有限公司,国网信息通信产业集团有限公司
- 当前专利权人: 福建亿榕信息技术有限公司,国网信息通信产业集团有限公司
- 当前专利权人地址: 福建省福州市鼓楼区软件大道89号G区20号楼;
- 代理机构: 福州科扬专利事务所
- 代理商 林朝熙
- 主分类号: G06F16/25
- IPC分类号: G06F16/25 ; G06F16/28 ; G06Q50/06
摘要:
本发明涉及一种通用电力非结构化数据转结构化数据方法,包括:获取非结构化数据;提取非结构化数据的文件属性为元数据;将所述非结构化数据转换为文本数据;提取文本数据中的关键信息;组合所述元数据和关键信息,得到所述非结构化数据对应的结构化数据。本发明使用元数据描述文件的属性信息,即实现了非结构化数据存储与应用的解耦,又保留了非结构化数据基于文件名称、类型等属性检索的传统应用方式;同时利用json格式存储元数据、关键信息、结构化数据,定义、规范了非结构化数据采集、处理、信息提取及结构化数据融合、存储等环节数据格式,统一了非结构化数据的描述结构,提供了电力多类别非结构化数据转换的标准化通用流程。