基于多智能体深度强化学习的分布式决策方法

    公开(公告)号:CN116050740A

    公开(公告)日:2023-05-02

    申请号:CN202211639045.4

    申请日:2022-12-20

    Abstract: 一种基于多智能体深度强化学习的分布式决策方法,构建基于去中心化的部分可观测马尔科夫决策过程的卫星观测与数据下传的集成调度问题模型,将每颗卫星视为具有自主决策能力的智能体,每个智能体可对观测任务进行自主决策,确定地面目标的观测时间以及观测数据的下传时间,使得调度周期内的总收益最大,在在线阶段采用训练后的卫星集群调度网络实时根据观测任务数据得到卫星集群的决策结果,实现各卫星分布式决策各观测任务是否执行、执行时间、观测数据的下传时间以及下传地面站。本发明能够在进行卫星观测任务规划的同时动态进行卫星观测数据下传,显著提高卫星集群的观测效率。

Patent Agency Ranking