-
公开(公告)号:CN118647032A
公开(公告)日:2024-09-13
申请号:CN202410632869.1
申请日:2024-05-21
Applicant: 东南大学
IPC: H04W16/18 , G05D1/695 , H04W16/22 , H04W84/06 , H04B7/185 , H04L41/16 , G06N3/0464 , G06N3/045 , G06N3/092 , G05D109/20
Abstract: 本发明公开了一种基于内在好奇心机制的多无人机通信系统优化控制方法。目标是学习一种最优的多无人机集中控制策略,使无人机能够通过好奇心驱动的探索找到城市环境中的照明区域,并收集能量,持续稳定地为用户提供通信服务。首先,提出了一种基于强化学习RL的多无人机集中控制策略,以最大化累积通信服务分数。在提出的框架中,由内在好奇心模块ICM产生的好奇心奖励可以作为一种内部激励信号,允许无人机在没有任何先验知识的情况下探索环境。其次,提出了一种两阶段探索协议,便于实际实现。本发明的方法可以在开发密集型阶段获得更高的累计通信服务分数,获得更为准确的服务路径,并能很好地处理勘探‑开采的权衡。