-
公开(公告)号:CN104978336A
公开(公告)日:2015-10-14
申请号:CN201410137127.8
申请日:2014-04-08
IPC分类号: G06F17/30
摘要: 本发明涉及信息技术处理领域,具体涉及一种基于Hadoop分布式计算平台的非结构化数据存储系统;包括以下步骤:S1:客户端通过调用HDFS类DistributedFileSystem对象调用create()函数在文件系统的命名空间中创建了一个新文件,该新文件还没有相应的数据块;S2:namenode执行检查确保当前创建的文件还不存在并且客户端有创建该文件的权限,检查通过则创建新文件记录,若检查不通过则文件创建失败并抛出异常;S3:客户端在给创建的新文件写入非结构化数据时,非结构化数据被分成一个个的数据包,并写入内部队列,HDFS的DataStreamer处理数据队列,根据datanode的队列列表要求namenode分配适合的新块来存储数据备份;大大的降低了存储数据所需要昂贵存储设备价格,并且在数据存储过程中,HDFS拥有很好的数据容灾机制。
-
公开(公告)号:CN103488702A
公开(公告)日:2014-01-01
申请号:CN201310400164.9
申请日:2013-09-06
IPC分类号: G06F17/30
CPC分类号: G06F17/30613 , G06F17/30657 , G06F17/30864
摘要: 本发明涉及信息技术处理领域,具体涉及一种基于SorlCloud非结构化数据检索方法和系统;包括:用户通过向部署在servlet容器中的Solr Web的应用程序发送HTTP请求来启动索引和搜索;Apache Solr接收用户发送的检索请求,确定要使用的适当的SolrRequestHandler,然后处理请求;Apache Solr调用搜索接口通过发送HTTP将符合检索条件的对象返回给用户;本发明有益效果在于:其实时性好、占用资源少,本发明检索耗费时间从原来的10秒以上缩短至亚秒级。
-