数据同步的方法、装置、计算机设备及存储介质

    公开(公告)号:CN117112696A

    公开(公告)日:2023-11-24

    申请号:CN202311104654.4

    申请日:2023-08-30

    摘要: 本发明涉及数据同步技术领域,公开了数据同步的方法、装置、计算机设备及存储介质,该方法包括:将实时捕获的源端数据库的DML数据缓存至缓存队列;所述缓存队列用于缓存多条DML数据;根据DML数据的操作类型,将所述缓存队列中非冗余的DML数据分类聚合为多个缓存子队列;非冗余的DML数据包括所述缓存队列中对应同一数据对象的最后一个DML数据,所述缓存子队列中的DML数据属于同一操作类型;以所述缓存子队列为单位,向目标端数据库同步所述缓存队列的DML数据。本发明可以对同一操作类型的多个DML数据批量入库,只需少量I/O操作,可以减少数据时延,能够提升端到端数据同步的效率,保证实时性,且可以大幅度提升吞吐量。

    同步参数动态调整方法、装置和设备

    公开(公告)号:CN117609955A

    公开(公告)日:2024-02-27

    申请号:CN202311413406.8

    申请日:2023-10-27

    摘要: 本发明提供一种同步参数动态调整方法、装置和设备,用于解决不能根据执行环境动态适配CDC同步作业任务同步参数的技术问题。本发明采集历史CDC同步作业的端点信息、同步参数、节点资源信息及任务性能指标等作业信息作为训练样本数据,训练针对批量大小的机器学习预测模型,在进行CDC同步作业任务调度时,基于当前指定时间区间内的作业信息,使用训练好的预测模型预测最优批量大小参数,动态设置CDC同步作业任务的批量大小参数,使得批量大小的同步参数更加适配实际业务场景,提高同步配置的智能化和同步的效率。