基于Hadoop分布式文件系统的数据备份方法及系统
摘要:
本发明公开了一种基于Hadoop分布式文件系统的数据备份方法及系统,方法包括通过HDFS客户端对文件夹通过快照的方式备份,通过客户端生成文件夹的时间点快照,文件夹内的数据存储至外部存储介质。系统包括HDFS系统以及与该系统连接的存储服务器,所述储服务器包含存储介质和文件索引数据库;所述存储介质用于保存系统文件数据,文件索引数据库用于保存系统文件元数据。本发明能够提高HDFS中数据的安全性,防止Hadoop集群发生灾难,能够自动化、快速恢复系统数据,保护公司数据完整性、一致性。
0/0