智能决策方法及装置、电子设备、可读存储介质

    公开(公告)号:CN118153629A

    公开(公告)日:2024-06-07

    申请号:CN202410249830.1

    申请日:2024-03-05

    IPC分类号: G06N3/0455 G06N3/0985

    摘要: 本公开提供了一种智能决策方法及装置、电子设备、可读存储介质,该方法包括:基于第一任务的决策知识信息确定所述第一任务对应的模型参数;基于所述模型参数对决策模型的网络参数进行调整;所述决策模型为第二任务的决策模型;所述网络参数调整后的决策模型用于任务决策。本公开提供的智能决策方法及装置、电子设备、可读存储介质可以提高智能体在新决策任务中决策的准确性。

    多任务模型训练方法及装置、电子设备、可读存储介质

    公开(公告)号:CN117789005A

    公开(公告)日:2024-03-29

    申请号:CN202410056168.8

    申请日:2024-01-15

    IPC分类号: G06V10/82 G06N3/0464 G06N3/08

    摘要: 本公开提供了一种多任务模型训练方法及装置、电子设备、可读存储介质,属于多任务决策领域,该方法包括:根据训练任务对训练数据集进行划分,得到多个子数据集;确定每个子数据集对应的任务标签,将每个子数据集对应的任务标签转换为每个子数据集对应的任务掩码;基于每个子数据集对应的任务掩码对多任务模型中的权重参数进行筛选,得到每个子数据集对应的第一权重参数;将多个子数据集依次输入至多任务模型中对多任务模型进行训练。本公开提供的多任务模型训练方法及装置、电子设备、可读存储介质能够根据任务掩码找到多个任务之间的共同特征,从而能够高效利用权重参数,同时使模型的计算开销大的问题得到缓解。