-
公开(公告)号:CN118493398A
公开(公告)日:2024-08-16
申请号:CN202410829309.5
申请日:2024-06-25
申请人: 北京科技大学
摘要: 本发明提供一种机械臂自适应固定时间控制方法,属于机械臂领域,所述方法包括:通过机械臂的每个关节处的传感器得到每个关节的位置信息和每个关节的速度信息;基于机械臂的期望位置和每个关节的位置信息得到位置误差,基于位置误差和李雅普诺夫理论得到虚拟控制器,基于虚拟控制和速度信息得到速度误差;基于每个关节的速度误差和神经网络基函数,得到神经网络基函数权重的自适应更新律,根据神经网络基函数权重的自适应更新律,得到实时更新的神经网络权重;基于每个关节的位置误差、每个关节的速度误差、神经网络基函数以及实时更新的神经网络权重,得到机械臂每个关节的控制力矩,本方法能够实现精准的轨迹跟踪效果。
-
公开(公告)号:CN118673954A
公开(公告)日:2024-09-20
申请号:CN202410619346.3
申请日:2024-05-19
申请人: 北京科技大学
摘要: 本发明涉及强化学习和多智能体博弈技术领域,特别是指一种主任务和辅助任务并行的智能体分配方法及装置。方法包括:基于ATP框架,确定团队主任务以及个人辅助任务,根据Actor‑Critic框架,确定团队策略以及个人策略,确定团队策略中执行动作的奖励和每个个人策略中执行动作的奖励;根据个人策略、个人策略中执行动作的奖励、团队策略以及团队策略中执行动作的奖励,确定个人策略与团队策略之间的相似度;将经验放置到ATP框架的经验池中,并对经验池中的经验进行排序;以相似度为约束,基于经验池的经验回放机制,对个人策略和团队策略分别进行更新。采用本发明,可以在提高多智能体任务训练效率的同时,促进智能体间的合作,不会增加额外的计算负担。
-