航天器逆光抵近智能轨道控制方法、装置和存储介质

    公开(公告)号:CN113325704B

    公开(公告)日:2023-11-10

    申请号:CN202110450164.4

    申请日:2021-04-25

    Abstract: 本发明实施例提供一种航天器逆光抵近智能轨道控制方法,包括:根据开普勒轨道动力学方法在仿真环境中建立自身航天器运动轨迹与目标航天器运动轨迹的运动学模型;从所述运动学模型中获取自身航天器及目标航天器在t0时刻的观测量以及所述目标航天器在t0时刻的速度增量;将所述自身航天器的t0时刻的观测量输入训练效果收敛的动作网络计算t0时刻所述自身航天器的速度增量,根据所述速度增量对所述自身航天器的轨道进行控制;根据t0+T时刻所述自身航天器和目标航天器的观测量、方位角,判断速度增量进行轨道控制后自身航天器是否处于目标航天器的逆光观测范围内。利用本发明实施例可实现航天器间的逆光观测范围判断。

    航天器在轨博弈的仿真模拟方法、系统及存储介质

    公开(公告)号:CN113268859B

    公开(公告)日:2023-07-14

    申请号:CN202110448705.X

    申请日:2021-04-25

    Abstract: 本发明实施例提供一种航天器在轨博弈的仿真模拟系统,包括实时解算航天器随时间变化的位置、速度、姿态、姿态角信息的运动学模型装置,对航天器数量、机动能力、速度增量幅值、即时奖励函数、太阳方位角、碰撞情况、通讯网络、观测量进行定义的场景定义装置,建立智能算法的神经网络模型的神经网络模型建立装置,调用神经网络模型并根据航天器观测量及速度增量、t0+T时刻航天器观测量及即时奖励函数对动作网络、评价网络进行训练的智能算法装置,将神经网络模型的训练过程数据通过图形方式呈现的结果输出与性能评估装置,可视化地呈现所述航天器的运动轨迹的场景实时显示装置,利用本技术方案可以实现航天器运行状态及运动轨迹的精确模拟与评估。

    一种深度强化学习的轻量抓取网络建模方法

    公开(公告)号:CN116305624A

    公开(公告)日:2023-06-23

    申请号:CN202310118848.3

    申请日:2023-02-03

    Abstract: 一种深度强化学习的轻量抓取网络建模方法,包括:建立机器人物体抓取仿真场景,在仿真场景中构建物体抓取工作空间,并模拟机器人物体抓取试验设备;建立轻量特征提取网络,网络输入为仿真场景中物体抓取空间的RGB‑D图像,网络输出为提取的图像特征向量;将所述图像特征向量输入策略网络,网络输出执行动作的概率分布的均值和方差;根据所述执行动作的概率分布的均值和方差得到执行动作的正态概率分布,在仿真场景中执行相应的动作,得到奖励,仿真环境进入下一环境状态;收集环境状态、执行的动作、奖励及下一状态作为经验,更新特征提取网络和策略网络,直到训练曲线收敛,得到训练好的轻量抓取网络模型。

    航天器追逃智能轨道控制方法、装置和存储介质

    公开(公告)号:CN113311851B

    公开(公告)日:2023-06-16

    申请号:CN202110450195.X

    申请日:2021-04-25

    Abstract: 本发明实施例提供一种航天器追逃智能轨道控制方法,包括:从预先建立的追逐航天器和被追逐航天器的运动轨迹的运动学模型中获取t0时刻所述追逐航天器和被追逐航天器的观测量;将所述追逐航天器和被追逐航天器的观测量分别输入各自训练效果收敛的动作网络中计算t0时刻所述追逐航天器和被追逐航天器的速度增量;根据t0时刻所述追逐航天器和被追逐航天器的速度增量对追逐航天器和被追逐航天器进行轨道控制,获取t0+T时刻所述追逐航天器和被追逐航天器的观测量,根据观测量判断按照所述t0时刻的速度增量进行轨道控制后所述追逐航天器和被追逐航天器之间是否追逃成功。利用本发明实施例提供的技术方案可以实现航天器之间的准确追逃控制。

    一种基于能力模型的航天器任务推演方法和系统

    公开(公告)号:CN113377119B

    公开(公告)日:2023-05-09

    申请号:CN202110432096.9

    申请日:2021-04-21

    Abstract: 本发明公开了一种基于能力模型的航天器任务推演方法和系统,该方法包括:进行态势评估,得到态势判定结果和基本能力指标集合;以n个1级期望态势为目标进行1级任务序列规划,并进行基于能力模型的多目标优化求解,得到1级基本能力指标集合;将各1级期望态势作为初始态势,各1级基本能力指标集合作为初始基本能力指标集合,重复任务序列规划和多目标优化求解的步骤,得到2级基本能力指标集合,依次类推,得到K级基本能力指标集合;选择最优态势发展支链,生成基于能力模型的任务推演结果。本发明解决了航天器实现对自身能力的快速评估、任务级指令的快速响应以及能力资源的快速分配问题,增强了对动态不确定场景的自主应变能力。

    基于偏随机密钥遗传算法的不规则岩石三维装箱优化方法

    公开(公告)号:CN115470695A

    公开(公告)日:2022-12-13

    申请号:CN202211001163.2

    申请日:2022-08-19

    Abstract: 一种基于偏随机密钥遗传算法的不规则岩石三维装箱优化方法,包括:对岩石样本进行视觉采样和三维重建;对网格模型进行处理;对偏随机密钥遗传算法进行初始化,生成初代种群;建立容器及OBB包围盒的碰撞模型,设置其位置和姿态;建立各OBB包围盒对应的岩石样本的碰撞模型,设置其位置和姿态;添加重力和摩擦力,计算容器空间占有率作为个体的适应度;根据适应度大小将种群个体分为精英个体和一般个体两类,按照偏随机密钥遗传算法对种群进行复制、交叉和变异操作,产生下一代种群;重复执行,当满足终止条件时,输出最大适应度个体解码装箱后各岩石样本的最终位置和姿态作为最终装箱方案。本发明能实现有限容器内对不规则岩石最大化装箱。

    面向空间博弈的自主驱离方法、装置和存储介质

    公开(公告)号:CN113353289B

    公开(公告)日:2022-12-13

    申请号:CN202110450161.0

    申请日:2021-04-25

    Abstract: 本发明实施例提供一种面向空间博弈的策略梯度强化学习自主驱离策略,包括:选取一护卫星作为第一航天器和第二航天器的参照点,获取第二航天器的预定的水滴运动轨迹,在仿真环境中建立CW轨道相对运动学模型;获取t0时刻第一航天器和第二航天器的观测量,根据所述水滴运动轨迹获取所述第二航天器的速度增量;将t0时刻第一航天器的观测量输入训练效果收敛的动作网络计算t0时刻所述第一航天器的速度增量,进行轨道控制;计算t0+T时刻第一航天器观测量,根据所述t0时刻第二航天器的速度增量计算t0+T时刻第二航天器的观测量;根据t0+T时刻第一航天器和第二航天器的观测量计算距离并进行驱离判定。利用本发明实施例提供的技术方案可以实现航天器之间的准确驱离控制及判定。

    一种基于残差强化学习的机器人自主化装配方法

    公开(公告)号:CN115390439A

    公开(公告)日:2022-11-25

    申请号:CN202210999879.X

    申请日:2022-08-19

    Abstract: 本发明涉及一种基于残差强化学习的机器人自主化装配方法,步骤包括:根据机器人装配过程中的状态st定义笛卡尔空间控制指令;在机器人末端与装配表面接近阶段设置k1=0;当Fext>Fmax时,机器人与装配表面发生了第一次接触;判断待装配物体是否进入到装配孔位;进入插入阶段,设置k2=0,机器人执行插入操作,当检测到外力Fext>Fd/2时,装配成功。本发明针对装配过程中的接近、搜索、插入三个阶段,分别设计相应的装配策略,使用基于视觉和力觉感知融合的残差强化学习方法和基于解析方法的力控制策略,实现端到端的机器人自学习装配。

    一种基于图像域的机械臂高效操控归置学习奖励训练方法

    公开(公告)号:CN115302511A

    公开(公告)日:2022-11-08

    申请号:CN202211001178.9

    申请日:2022-08-19

    Abstract: 本发明公开了一种基于图像域的机械臂高效操控归置学习奖励训练方法,实现杂乱场景中机械臂自主归置物体任务。该任务中,由于空间受限、复杂碰撞等约束的存在,导致终止状态是不可预测的,从而对奖励函数的设计带来了困难。本专利对强化学习的奖励是“步骤奖励”和“完成奖励”的组合,通过在图像域中合并来量化终端状态的性能,这将引导终端状态收敛到一个更好的域,而不是特定的值。以鼓励快速排列盒子中分散的对象,同时最小化对象之间的间隙,对不同数量、不规则形状的物体以及间断情况具有更好的适应性。

Patent Agency Ranking