一种基于强化学习的安全吸引域估计与安全控制方法

    公开(公告)号:CN118655870A

    公开(公告)日:2024-09-17

    申请号:CN202410670846.X

    申请日:2024-05-28

    IPC分类号: G05B23/02

    摘要: 一种基于强化学习的安全吸引域估计与安全控制方法,它属于安全控制技术领域。本发明解决了在现有轮式机器人控制方法中,当稳定性与安全性相冲突时需要牺牲稳定性来优先考虑安全性的问题。本发明引入了控制障碍函数和子集合估计的方法,并在统一框架内制定了一个优化问题,再引入强化学习和多项式求和来表达最优安全控制器和控制障碍函数,本发明方法可以在保证系统安全性的同时,使用李雅普诺夫函数保证了系统的稳定性,即当稳定性与安全性相冲突时,本发明方法也不需要牺牲稳定性来优先考虑安全性。而且本发明所提出的方法不依赖于精确的模型知识。本发明可以应用于安全控制技术领域。