模型处理方法、设备、存储介质和程序产品

    公开(公告)号:CN117910528A

    公开(公告)日:2024-04-19

    申请号:CN202211274577.2

    申请日:2022-10-18

    Abstract: 本申请实施例提供的一种模型处理方法、设备、存储介质和程序产品,该方法包括:确定待处理模型对应的数据样本空间和指定结构的初始新模型,所述指定结构的初始新模型与所述待处理模型的输入参数相同;根据所述数据样本空间进行数据采样,得到初始样本集合;对所述初始样本集合进行筛选,得到筛选样本集合,所述筛选样本集合中每个样本数据的不确定度均大于预设阈值,所述不确定度与所述指定结构的初始新模型和所述待处理模型之间的差异程度呈正相关;根据所述筛选样本集合对所述指定结构的初始新模型进行训练,得到最终的新模型。本申请实现了对参与训练的样本数据集进行压缩,降低了模型计算代价和内存占用,提高模型处理效率。

    选择执行计划的方法及装置
    2.
    发明公开

    公开(公告)号:CN118363985A

    公开(公告)日:2024-07-19

    申请号:CN202310096561.5

    申请日:2023-01-18

    Abstract: 本申请实施例提供了一种选择执行计划的方法以及数据库系统,该方法应用于数据库系统,该方法包括:确定查询对应的多个执行计划的执行代价的估计值,其中,多个执行计划中的第一执行计划中的第一算子的执行代价的估计值是通过将第一算子的目标特征的特征值输入至第一代价模型进行处理得到的,第一代价模型部署于数据库系统,第一代价模型是基于第一训练数据集训练得到的;根据多个执行计划的执行代价的估计值从多个执行计划中确定目标执行计划。本申请实施例的方案有利于在保证处理效率的同时,提高执行代价的估计的准确度。

    一种基数估计方法及装置
    3.
    发明公开

    公开(公告)号:CN116932580A

    公开(公告)日:2023-10-24

    申请号:CN202210334793.5

    申请日:2022-03-31

    Abstract: 本申请公开了一种基数估计方法及装置,该方法包括:根据目标分布特征和映射关系信息,从多个模型类型中选择目标模型类型,映射关系信息包括这多个模型类型与预知的分布特征之间的映射关系,目标分布特征是从基于分析指令采集到的样本数据中提取的;根据目标模型类型,获得目标模型类型对应的目标模型,目标模型用于对数据库的查询指令执行基数估计。实施本申请,能够实现用于基数估计的模型的精准构建,有利于提高基数估计的准确率。

    分布式机器学习方法、设备、存储介质及程序产品

    公开(公告)号:CN118114780A

    公开(公告)日:2024-05-31

    申请号:CN202211528733.3

    申请日:2022-11-30

    Inventor: 聂文 孙佶 李士福

    Abstract: 本申请实施例公开人工智能领域中的一种分布式机器学习方法、设备、存储介质及程序产品,应用于数据节点,该分布式机器学习方法包括:获取第一执行计划和第一数据,其中第一执行计划包括第一算子,第一算子用于进行模型训练;根据第一数据和第一算子获得第一模型信息响应于获得第一模型信息,将第一模型信息传输至其他数据节点,并获取其他数据节点传输的第二模型信息;根据第一模型信息和第二模型信息得到更新后的模型;根据第一数据和更新后的模型进行模型训练,直至训练完成。在模型训练过程中,实现各个数据节点之间通信,各个数据节点可以通信彼此的训练数据,保证模型更新的泛化性和正确拟合。

Patent Agency Ranking