Invention Publication
CN108090186A 一种大数据平台上的电力数据去重方法
无效 - 撤回
- Patent Title: 一种大数据平台上的电力数据去重方法
- Patent Title (English): Power data de-duplication method used on big data platform
-
Application No.: CN201711357303.9Application Date: 2017-12-16
-
Publication No.: CN108090186APublication Date: 2018-05-29
- Inventor: 邹保平 , 赖伟平 , 张杨华 , 林佳能 , 林笔星 , 苏志勇 , 陈明辉 , 林庆瑞 , 林宇 , 徐禄
- Applicant: 国网信通亿力科技有限责任公司 , 国家电网公司
- Applicant Address: 福建省厦门市思明区厦门市软件园二期观日路36号402室
- Assignee: 国网信通亿力科技有限责任公司,国家电网公司
- Current Assignee: 国网信通亿力科技有限责任公司,国家电网公司
- Current Assignee Address: 福建省厦门市思明区厦门市软件园二期观日路36号402室
- Agency: 福州智理专利代理有限公司
- Agent 康永辉
- Main IPC: G06F17/30
- IPC: G06F17/30 ; G06Q10/10 ; G06Q50/06

Abstract:
本发明涉及一种大数据平台上的电力数据去重方法,本发明重复数据删除使用的总体架构为分布式:分布式的总体架构通过把去重过程分布到多个节点上执行,从而避免系统瓶颈和单点故障。本发明对数据进行判重之前,会对数据内容本身进行哈希计算,将不定长度的文件内容转化为固定长度的指纹可以大大地提高判重的效率。哈希计算采用两种类型的算法:MD5算法,SHA-1算法。使用两种函数进行计算,这减少了些函数都存在着数据冲突的可能性,即不同的数据内容可能对应同一个数据哈希值。
Information query