-
公开(公告)号:CN115454096B
公开(公告)日:2024-07-19
申请号:CN202211227150.7
申请日:2022-10-09
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
摘要: 一种基于课程强化学习的机器人策略训练系统及训练方法,它属于无人系统自主决策与控制领域。本发明解决了现有方法在针对于机器人的策略训练方面难以获得好的决策与控制效果的问题。本发明针对异构多机器人不同类型的任务模式,以复杂环境的动力学模型为输入,构建基于课程学习的多机器人联合任务决策课程学习训练架构。考虑训练过程中任务难度的循序渐进,建立基于复杂环境动力学模型的参数自主生成算法和目标自主生成算法。然后在此基础上,建立课程难度评估与标校算法,反馈给自优化强化学习算法。本发明方法可以应用于无人系统的自主决策与控制。
-
公开(公告)号:CN115454096A
公开(公告)日:2022-12-09
申请号:CN202211227150.7
申请日:2022-10-09
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
IPC分类号: G05D1/02
摘要: 一种基于课程强化学习的机器人策略训练系统及训练方法,它属于无人系统自主决策与控制领域。本发明解决了现有方法在针对于机器人的策略训练方面难以获得好的决策与控制效果的问题。本发明针对异构多机器人不同类型的任务模式,以复杂环境的动力学模型为输入,构建基于课程学习的多机器人联合任务决策课程学习训练架构。考虑训练过程中任务难度的循序渐进,建立基于复杂环境动力学模型的参数自主生成算法和目标自主生成算法。然后在此基础上,建立课程难度评估与标校算法,反馈给自优化强化学习算法。本发明方法可以应用于无人系统的自主决策与控制。
-
公开(公告)号:CN113867178A
公开(公告)日:2021-12-31
申请号:CN202111248683.9
申请日:2021-10-26
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
IPC分类号: G05B17/02
摘要: 面向多机器人对抗的虚实迁移训练系统,涉及机器人对抗技术领域,针对现有决策训练过程中,单纯使用真实环境进行决策训练时训练成本较高,安全性较差的问题,本申请通过使用创新的训练方法,大大地减少了决策训练的成本,相比于传统的方法能够更加地充分考虑实际环境中的各种因素,经过该方法训练得到的决策适应度高、所需的训练时间短,决策准确度高,响应速度快等优点。通过该训练方法可以实现机器人在各种复杂环境下快速准确的完成决策训练。
-
公开(公告)号:CN113867178B
公开(公告)日:2022-05-31
申请号:CN202111248683.9
申请日:2021-10-26
申请人: 哈尔滨工业大学 , 中国航天科工集团第二研究院
IPC分类号: G05B17/02
摘要: 面向多机器人对抗的虚实迁移训练系统,涉及机器人对抗技术领域,针对现有决策训练过程中,单纯使用真实环境进行决策训练时训练成本较高,安全性较差的问题,本申请通过使用创新的训练方法,大大地减少了决策训练的成本,相比于传统的方法能够更加地充分考虑实际环境中的各种因素,经过该方法训练得到的决策适应度高、所需的训练时间短,决策准确度高,响应速度快等优点。通过该训练方法可以实现机器人在各种复杂环境下快速准确的完成决策训练。
-
公开(公告)号:CN118192653A
公开(公告)日:2024-06-14
申请号:CN202410400906.6
申请日:2024-04-03
申请人: 哈尔滨工业大学
摘要: 一种基于轴角交叉耦合的卫星编队姿态协同控制方法,它属于卫星编队系统与协同控制技术领域。本发明解决了现有方法无法实现编队中成员卫星响应速度不同情况下的高性能姿态协同控制的问题。本发明方法为:步骤1、基于成员卫星姿态跟踪误差四元数求解姿态误差的轴角信息并传递给其他成员卫星;步骤2、根据轴角信息计算成员卫星与其相通信卫星的交叉耦合协同误差角并限幅,通过自适应函数计算跟踪误差角修正量,再对成员卫星的跟踪误差角进行修正并限幅,计算修正后的跟踪误差四元数;步骤3、计算成员卫星的跟踪误差四元数变化率,设计成员卫星的自适应终端滑动模态,最后计算成员卫星的姿态控制量。本发明方法可以应用于卫星编队的协同观测任务。
-
公开(公告)号:CN114911263B
公开(公告)日:2023-05-12
申请号:CN202210656391.7
申请日:2022-06-10
申请人: 哈尔滨工业大学
IPC分类号: G05D1/10
摘要: 基于同伦法的多无人机同步到达轨迹规划方法、存储介质及设备,属于多无人机轨迹规划领域。为了解决目前的多无人机轨迹规划或者控制方法不能很好的满足多无人机同步到达的问题。本发明基于架无人机的运动学模型和轨迹角和控制变量遵守约束构建多无人机同步到达问题的模型,并对同步到达问题进行离散化,然后基于无人机的初始位置、初始姿态、目标位置、目标姿态,轨迹角的上、下界,轨迹角的控制变量的上、下界,航向角的控制变量的上界,以及距离步长,经过同步到达规划方法得到同步轨迹并基于同伦法对无人机的轨迹进行具体规划。本发明主要用于多无人机的同步到达轨迹规划。
-
公开(公告)号:CN114995137B
公开(公告)日:2023-04-28
申请号:CN202210617587.5
申请日:2022-06-01
申请人: 哈尔滨工业大学
IPC分类号: G05B13/04
摘要: 基于深度强化学习的绳驱并联机器人控制方法,属于绳驱并联机器人领域,本发明为解决现有精确动力学模型没有考虑不确定性的影响或者在运动过程中绳驱并联机器人发生了变化,控制性能低的问题。本发明方法包括以下步骤:第一步、建立绳驱并联机器人的动力学模型,将绳驱并联机器人的动力学模型描述成马尔科夫决策过程;第二步、利用Lyapunov的柔性actor‑critic强化学习算法框架获取动作控制信号ur(m),第三步、将基本控制器输出的动作控制信号ua(m)与强化学习算法框架获取动作控制信号ur(m)叠加生成绳驱并联机器人的控制信号。
-
公开(公告)号:CN115903914A
公开(公告)日:2023-04-04
申请号:CN202211702605.6
申请日:2022-12-28
申请人: 哈尔滨工业大学
IPC分类号: G05D1/10
摘要: 多智能体编队系统允许最大通信数据延迟的判定方法,解决了如何有效的判定允许最大通信数据延迟的问题,属于多智能体领域。本发明包括:S1、获取领航‑跟随多智能体编队系统的参数及迭代步长ΔT;S2、计算得到分块矩阵C、E;S3、初始化迭代次数f=1,设置时滞变量初始值d0=ΔT;S4、将d0代入判定条件,计算判定条件的可行解,如果有解,转入S5,如果没有解,减少迭代步长ΔT,转入S2,或更换通信拓扑的拉普拉斯矩阵及领航者与跟随者通信矩阵,转入S3;S5、更新迭代步数f=f+1;S6、df‑1=fΔT,将df‑1代入判定条件,计算判定条件的可行解,如果有解,转入S5,如果没有解,最大通信延迟dM为(f‑1)ΔT。
-
公开(公告)号:CN115861481A
公开(公告)日:2023-03-28
申请号:CN202211666797.X
申请日:2022-12-23
申请人: 哈尔滨工业大学 , 成都川哈工机器人及智能装备产业技术研究院有限公司
摘要: 一种基于激光惯性实时动态对象去除的SLAM系统,涉及机器人SLAM领域,针对现有技术中在位姿估计之前并未去除动态对象,进而导致得到的位姿输出不准确的问题,本申请先进行动态对象移除,再进行特征匹配定位,解决了激光SLAM系统建图过程中,动态对象留下的残像问题,降低动态对象对定位精度的影响,提高定位和映射的准确性。本申请通过垂直体素高度描述符来描述动态对象的占用,并将IMU预积分作为初始姿态估计来优先去除动态对象,然后采用加权优化策略得到最优姿态估计,减轻了动态对象的影响,提高了位姿输出的准确性。
-
公开(公告)号:CN115826414A
公开(公告)日:2023-03-21
申请号:CN202211712575.7
申请日:2022-12-26
申请人: 哈尔滨工业大学
IPC分类号: G05B13/04
摘要: 拒绝服务攻击下基于测量数据的跟踪控制方法,涉及信息物理系统领域。解决了现有拒绝服务攻击下信息物理系统跟踪控制方法在跟踪过程需依赖于系统动态,而系统动态获取困难,不便于对参考系统动态进行有效跟踪的问题。本发明使用输入输出数据对增广系统状态ξk和二次值函数V(xk,rk)进行重建,在该基础上建立基于基于测量数据的Bellman方程,求得基于输入输出数据的安全跟踪控制策略uk的构成,再通过基于测量数据的在线迭代强化学方式,求解出控制策略uk中的最优的中间变量核矩阵从而使得控制策略uk最优,实现对参考轨迹动态rk的准确跟踪。本发明主要用于参考轨迹动态进行跟踪。
-
-
-
-
-
-
-
-
-