发明授权
- 专利标题: 一种自适应采样与查询方法及系统
-
申请号: CN202110231990.X申请日: 2021-03-02
-
公开(公告)号: CN112883064B公开(公告)日: 2022-11-15
- 发明人: 王建民 , 沈恩亚 , 宋怡然 , 沈磊贤
- 申请人: 清华大学
- 申请人地址: 北京市海淀区双清路30号
- 专利权人: 清华大学
- 当前专利权人: 清华大学
- 当前专利权人地址: 北京市海淀区双清路30号
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 陈新生
- 主分类号: G06F16/2455
- IPC分类号: G06F16/2455 ; G06F16/2457 ; G06F16/26
摘要:
本发明提供一种自适应采样与查询方法及系统,该方法包括:基于波动度的余弦距离权重函数,计算每一个数据点的波动度权重,并按照所述波动度权重,使用二分查找算法对累积数据进行快速自适应分桶,使得分桶结果中所有桶的最大权重和最小;对每个分桶结果中的流式数据,通过多种采样算子提取相同数目的样本,以实现自适应的采样密度,得到对应的采样结果;基于采样结果,从低层级样本中采样得到高层级的样本,构建保持层级结果一致性的层级样本结构,并根据所述层级样本结构,构建层级查询引擎;当层级查询引擎查询到符合采样粒度的层级后,将保留当前层级的样本作为查询结果。本发明降低了采样误差,保证了数据查询结果的一致性与低延迟。
公开/授权文献
- CN112883064A 一种自适应采样与查询方法及系统 公开/授权日:2021-06-01