日志存储方法、装置、节点设备及存储介质

    公开(公告)号:CN112035410B

    公开(公告)日:2023-08-18

    申请号:CN202010833472.0

    申请日:2020-08-18

    摘要: 本申请公开了一种日志存储方法、装置、节点设备及存储介质,属于数据库技术领域。该方法包括:响应于目标事务的提交事件,确定第一存储介质的剩余容量,第一存储介质为用于存储日志的非易失性存储介质;响应于该剩余容量小于该目标事务的未缓存日志的数据量,创建日志检查点,将第二存储介质中基于修改操作产生的业务数据存储至第三存储介质;将该目标事务的未缓存日志写入到该第一存储介质。本申请通过直接在第一存储介质中持久化地存储日志,无需执行繁琐的双层日志缓存流程,大大节约了日志存储占用的空间,提升了数据库的系统性能,避免了限制数据库系统的吞吐量上限,有利于数据扩容。

    基于时序数据库的检索匹配方法和装置

    公开(公告)号:CN116089491A

    公开(公告)日:2023-05-09

    申请号:CN202211616863.2

    申请日:2022-12-15

    申请人: 清华大学

    IPC分类号: G06F16/2458 G06F16/2455

    摘要: 本发明提供一种基于时序数据库的检索匹配方法和装置,包括:获取时间序列元信息和时序数据变化趋势信息;基于所述时间序列元信息从预先创建的时序数据库中筛选出候选序列集;基于所述时序数据变化趋势信息对所述候选序列集进行匹配计算,以便从所述候选序列集的序列中找到每条序列的最匹配子序列。本发明根据时间序列元信息和时序数据变化趋势信息,从时序数据库筛选出候选序列集,再进行匹配计算,查询出数据库中最匹配用户所描述形状的子序列,支持了用户利用混合信息查出所需序列段,实现了时延更短的查询,从而使序列匹配的性能大幅提升。

    图布局优化方法和系统、电子设备及可读存储介质

    公开(公告)号:CN113127697B

    公开(公告)日:2022-11-15

    申请号:CN202110340361.0

    申请日:2021-03-30

    申请人: 清华大学

    摘要: 本发明提供一种图布局优化方法和系统、电子设备及可读存储介质,其中优化方法包括:基于对目标图采用图嵌入生成的节点特征向量,得到相似度矩阵;基于所述相似度矩阵和目标图的原始邻接矩阵,得到第一邻接矩阵;节点特征向量进行聚类,得到节点的聚类结果;基于所述聚类结果,对所述第一邻接矩阵进行损失层处理,得到第二邻接矩阵;采用所述第二邻接矩阵进行布局,得到所述目标图的布局结果。本发明通过将图嵌入得到的特征向量转化为矩阵的方法,将图嵌入得到的反映节点高维特征的节点特征向量融入布局过程中,通过使用这样的信息辅助布局过程,优化布局效果,生成更有实际应用意义的布局结果。

    基于遗传算法的任务调度信息的确定方法、装置和设备

    公开(公告)号:CN115145723A

    公开(公告)日:2022-10-04

    申请号:CN202210673085.4

    申请日:2022-06-15

    申请人: 清华大学

    IPC分类号: G06F9/50 G06F9/48 G06N3/12

    摘要: 本申请提供一种基于遗传算法的任务调度信息的确定方法、装置和设备,涉及计算机领域和任务处理技术领域。该方法包括:获取任务调度信息集合;遗传算法的遗传算子对任务调度信息集合进行处理,得到任务处理结果;对任务处理结果进行处理,得到任务调度信息的中间特征,以及任务调度信息的适应度;根据各任务调度信息的中间特征,确定下一轮遗传算法的遗传算子;基于达到预设条件时所得到的遗传算子,对任务调度信息集合进行处理,得到适应度更高的任务调度信息的集合。本申请的方法可以充分发挥遗传算法兼顾广度和深度搜索的特点,自动适配每一轮遗传算法使用的遗传算子,提升调度任务信息的准确性。

    文件并发分块上传方法、装置、电子设备及存储介质

    公开(公告)号:CN113824760A

    公开(公告)日:2021-12-21

    申请号:CN202110886685.4

    申请日:2021-08-03

    IPC分类号: H04L29/08 H04L29/06

    摘要: 本发明提供一种文件并发分块上传方法、装置、电子设备及存储介质,所述方法包括:接收客户端发送的待上传文件的元信息;根据元信息中的文件标识获取待上传文件的待上传文件块信息;待上传文件块信息包括待上传文件块的起始偏移量以及未完全传输的文件块的已传输字节数;计算允许并发的上传线程数,并将待上传文件块信息及允许并发的上传线程数发送给客户端;接收客户端的上传线程根据待上传文件块信息发送的文件块数据,根据文件块数据更新历史上传记录;重复执行上述过程,直至待上传文件块全部上传。本发明实施例提供的文件并发分块上传方法、装置、电子设备及存储介质,通过对文件上传线程的实时合理分配,实现了文件的并发高效上传。

    债券产品的潜在客户推荐方法和装置

    公开(公告)号:CN113592529A

    公开(公告)日:2021-11-02

    申请号:CN202110694000.6

    申请日:2021-06-22

    IPC分类号: G06Q30/02 G06Q30/06 G06Q40/06

    摘要: 本发明提供一种债券产品的潜在客户推荐方法和装置,所述方法包括:根据业务需求确定债券变量,基于债券变量获取目标债券的数据;对目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;将预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出目标债券的相似债券;获取相似债券在目标市场的持有账户以及每个持有账户持有相似债券的数量,并基于每个持有账户持有相似债券的数量,确定目标债券在所述目标市场的潜在客户。本发明能够实现在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下为新发债券推荐潜在客户,该相似债券推荐模型可灵活运用于多种推荐场景,普适性较高。

    一种自适应采样与查询方法及系统

    公开(公告)号:CN112883064A

    公开(公告)日:2021-06-01

    申请号:CN202110231990.X

    申请日:2021-03-02

    申请人: 清华大学

    摘要: 本发明提供一种自适应采样与查询方法及系统,该方法包括:基于波动度的余弦距离权重函数,计算每一个数据点的波动度权重,并按照所述波动度权重,使用二分查找算法对累积数据进行快速自适应分桶,使得分桶结果中所有桶的最大权重和最小;对每个分桶结果中的流式数据,通过多种采样算子提取相同数目的样本,以实现自适应的采样密度,得到对应的采样结果;基于采样结果,从低层级样本中采样得到高层级的样本,构建保持层级结果一致性的层级样本结构,并根据所述层级样本结构,构建层级查询引擎;当层级查询引擎查询到符合采样粒度的层级后,将保留当前层级的样本作为查询结果。本发明降低了采样误差,保证了数据查询结果的一致性与低延迟。

    多副本数据的时效性判断方法及装置

    公开(公告)号:CN111061595B

    公开(公告)日:2020-10-20

    申请号:CN201911303750.5

    申请日:2019-12-17

    申请人: 清华大学

    IPC分类号: G06F11/14 G06F16/27

    摘要: 本发明实施例提供一种多副本数据的时效性判断方法及装置,该方法包括:获取当前时刻的k个相互邻近的历史时刻的副本,并计算每两个相邻副本的时间差值和数据差值,以及当前时刻和最近副本的时间差值;将所有时间差值和数据差值,输入至预设的差值模型,输出当前时刻和最近副本的数据差值预测结果;若所述预测结果小于预设阈值,则判断所述最近副本具备时效性;其中,所述差值模型,根据具有时效性的两两相邻的k个时间差值和数据差值样本,进行训练后得到。该方法具有客观性,且无需找到分布式机器之间的强关联关系,便可实现数据时效性的有效判断,提高了多副本数据的时效性判断的准确率。