基于强化学习与事件触发的离散非线性系统混合容错协调跟踪控制方法

    公开(公告)号:CN118259588A

    公开(公告)日:2024-06-28

    申请号:CN202410260470.5

    申请日:2024-03-07

    申请人: 重庆大学

    发明人: 陈刚 胡彬 蒲嫦莉

    IPC分类号: G05B13/04

    摘要: 本发明涉及基于强化学习与事件触发的离散非线性系统混合容错协调跟踪控制方法,属于控制学习领域。该方法包括以下步骤:S1:问题描述;S2:事件触发函数设计;S3:基于神经网络的评价性能函数设计;S4:自适应分布式控制器设计;本发明设计算法针对执行器饱和以及执行器故障的非线性高阶严反馈多智能体系统,对实际控制系统中的系统部件的物理局限性以及执行器长期使用下产生的精度遗失问题具有很好的自适应控制能力。

    基于状态观测与经验池的非线性多智能体一致性方法

    公开(公告)号:CN114841074A

    公开(公告)日:2022-08-02

    申请号:CN202210540972.4

    申请日:2022-05-17

    申请人: 重庆大学

    IPC分类号: G06F30/27

    摘要: 本发明涉及一种基于状态观测与经验池的非线性多智能体一致性方法,属于计算机领域。首先在跟随者对领导者状态无法获取的场景下,使用反步法和动态面控制法为每个智能体设计了全维观测器来观测领导者的状态。之后,一致性问题就转换成了每个跟随者对各自的领导者状态观测器的最优跟踪问题。下一步针对控输入受非对称饱和约束定义了一个非二次代价函数来处理,然后定义新的增广系统下的最优控制问题,并使用强化学习策略算法来迭代求解,并分析了策略迭代下解的稳定性和最优性。对于最优控制的HJB方程难以直接求解的困难,本发明利用神经网络良好的逼近性质,使用actor‑critic框架进行求解。

    基于状态观测与经验池的非线性多智能体一致性方法

    公开(公告)号:CN114841074B

    公开(公告)日:2024-10-22

    申请号:CN202210540972.4

    申请日:2022-05-17

    申请人: 重庆大学

    IPC分类号: G06F30/27

    摘要: 本发明涉及一种基于状态观测与经验池的非线性多智能体一致性方法,属于计算机领域。首先在跟随者对领导者状态无法获取的场景下,使用反步法和动态面控制法为每个智能体设计了全维观测器来观测领导者的状态。之后,一致性问题就转换成了每个跟随者对各自的领导者状态观测器的最优跟踪问题。下一步针对控输入受非对称饱和约束定义了一个非二次代价函数来处理,然后定义新的增广系统下的最优控制问题,并使用强化学习策略算法来迭代求解,并分析了策略迭代下解的稳定性和最优性。对于最优控制的HJB方程难以直接求解的困难,本发明利用神经网络良好的逼近性质,使用actor‑critic框架进行求解。

    基于强化学习的新型智能协作配送机器人系统

    公开(公告)号:CN114895563A

    公开(公告)日:2022-08-12

    申请号:CN202210539999.1

    申请日:2022-05-17

    申请人: 重庆大学

    IPC分类号: G05B13/04

    摘要: 本发明涉及一种基于强化学习的新型智能协作配送机器人系统,属于机器人技术领域。通过对比现有的餐饮服务式机器人的实际情况,对硬件结构设计,软件流程以及整体的控制算法设计进行改进,同时将系统扩展到多服务机器人协作上。设计了一种系统动力模型未知,环境存在未知扰动,考虑输入约束以及引入多机防碰撞机制的条件下,利用SLAM技术的定位与导航来实现路径规划,利用强化学习和神经网络来实现智能配送机器人轨迹跟踪的最优控制。

    基于视觉的多智能体分布式快速SLAM方法

    公开(公告)号:CN114821127A

    公开(公告)日:2022-07-29

    申请号:CN202210540007.7

    申请日:2022-05-17

    申请人: 重庆大学

    摘要: 本发明涉及一种基于视觉的多智能体分布式快速SLAM方法,属于图像处理技术领域。在特征点匹配前,首先将相机采集到的图片进行分割,让特征点均匀分布在每个区域,使选取的特征点更具有代表性;其次设计了一种“点线”特征,生成新的词袋,并利用强化学习进行回环检测,解决了点特征在低纹理低对比度环境下性能不足的问题;由于对姿态矩阵不能直接运用凸优化算法,所以运用对偶原理将原问题转化为一个强凸的对偶问题,运用拉格朗日乘子法进行迭代求解,并证明了原问题与对偶问题的等价;之后,由于算法的收敛速度较慢,设计了一种基于随机矩阵的位姿平均算法,多智能体位姿收敛速度显著加快。