-
公开(公告)号:CN117708118A
公开(公告)日:2024-03-15
申请号:CN202311499153.0
申请日:2023-11-13
Applicant: 天津天地伟业信息系统集成有限公司
Abstract: 本发明涉及基于HBase数据库的倒排索引混合压缩方法,首先对倒排索引数据进行分块处理,将索引按照一定的规则划分为多个块。然后,对每个块进行压缩处理,采用不同的压缩算法对不同类型的数据进行压缩。通过对不同类型的数据采用不同的压缩算法,可以充分利用各种压缩算法的优势,提高压缩效率,并且减少数据在服务器上占用的磁盘空间,减少硬件成本。在解压阶段,根据压缩算法的类型,采用相应的解压算法对压缩后的数据进行解压。解压后的数据可以直接用于查询操作,无需再进行额外的处理。由于每个块都采用了不同的压缩算法,因此在解压阶段可以并行解压不同的块,提高解压效率。加速查询速度,提升检索体验。
-
公开(公告)号:CN117573664A
公开(公告)日:2024-02-20
申请号:CN202311600108.X
申请日:2023-11-28
Applicant: 天津天地伟业信息系统集成有限公司
IPC: G06F16/215 , G06F16/22 , G06F16/2453 , G06N5/04
Abstract: 本发明涉及基于GPU加速的RDF数据存储和查询方法,通过整合TD‑Hash索引技术的快速构建与查询优势、TD‑Snappy压缩技术的压缩比与压缩解压缩速度快和TD‑SPARQL图计算技术,实现了高性能和高效率的RDF数据存储和查询。该技术提供了高效的图数据存储和管理方式,能够在大规模图数据上进行快速的图计算和图分析。通过将RDF数据存储在图数据库中,并结合GPU加速和图计算算法,可以实现对图数据的高效处理和分析。并利用GPU的并行计算能力和高速内存,并采用数据压缩和索引技术,减小存储空间占用,提高查询响应时间和数据访问效率。基于GPU加速的RDF数据存储技术还可用于存储和管理知识图谱的三元组数据,以支持知识发现和推理。
-