一种基于数据湖的查询优化方法、装置及存储介质

    公开(公告)号:CN117667998A

    公开(公告)日:2024-03-08

    申请号:CN202311678652.6

    申请日:2023-12-08

    Abstract: 本发明涉及数据管理和查询优化领域,提供了一种基于数据湖的查询优化方法、装置及存储介质。本发明的目的在于解决数据湖存算分离架构,需要一种技术来减少网络传输带宽消耗,提升查询速度的技术问题。主要方案包括在数据湖中进行数据变化检测,根据数据变化和数据的冷热状态进行数据缓存管理,在查询计划优化阶段利用数据变化和数据缓存的信息,对已经缓存的数据,可以直接从缓存中获取,对于变化的未缓存的数据,从数据湖中查询;对查询结果进行整合,如果查询结果来自缓存,可以直接返回给用户;如果查询结果来自数据湖,需要将其与缓存中的数据合并成结果集返回给查询器,并根据数据的时间戳更新缓存中的最新数据,保证查询结果的准确性。

Patent Agency Ranking