-
公开(公告)号:CN119648791A
公开(公告)日:2025-03-18
申请号:CN202411706594.8
申请日:2024-11-26
Applicant: 北京控制工程研究所
Abstract: 本发明提供了一种月面微小机器人拍照位姿优化方法及装置,涉及月球探索领域,其中方法包括:根据待拍摄目标的实时RGB图像,确定所述图像的当前图像特征;确定所述当前图像特征和预设的期望图像特征是否满足相似性要求;若不满足,则根据所述当前图像特征和所述期望图像特征,确定改变拍照位姿的决策动作;并根据所述决策动作调整月面微小机器人至当前图像特征满足要求为止。本方案无需依赖精准定位信息,仅基于RGB图像进行机器人的拍照位姿优化,在月面未知环境中,能够自主适应环境,无需地面遥控。
-
公开(公告)号:CN119539018A
公开(公告)日:2025-02-28
申请号:CN202411531416.6
申请日:2024-10-30
Applicant: 北京控制工程研究所
IPC: G06N3/092 , G06N3/0499 , G06N3/084
Abstract: 一种双航天器在轨交互的双优化高效学习训练方法,针对进入指定目标区域的任务,充分考虑任务的时空特性,建立追踪星和目标星的相对轨道动力学以及目标区域数学模型,设计约束条件,建立追踪星和目标星的输赢条件。为了提升训练效率,设计两次优化的高效学习训练方法,首先另追踪星和目标星分别采用基于零控脱靶量的决策方法进行追逃交互,收集和分析双方交互过程的轨迹数据,采用神经网络对追踪星的动作进行拟合,用于指导后续训练;然后,利用强化学习对追踪星的决策网络进行二次训练,本发明能避免从零开始训练导致难以收敛的不足,训练得到的神经网络可以输出追踪星最优推力,实现在指定时刻进入指定区域。
-
公开(公告)号:CN119536283A
公开(公告)日:2025-02-28
申请号:CN202411706607.1
申请日:2024-11-26
Applicant: 北京控制工程研究所
Abstract: 本发明提供了一种基于知识引导的月面微小机器人路径智能规划方法及装置,涉及地外探测无人系统技术领域,其中方法包括:获取月面微小机器人拍摄的经过预处理的实际图像和目标图像;预处理包括下采样处理和语义分割处理;将实际图像和目标图像输入至强化学习决策模型,输出得到使机器人从当前位姿移动到拍摄与目标图像最相似图像的位姿的路径规划。所述强化学习决策模型的训练过程包括:利用由先验知识构建的预训练数据集,对初始神经网络进行深度学习预训练,得到初始决策模型;基于初始决策模型,采用强化学习方法进行微调训练,得到强化学习决策模型。本方案能够实现从视觉感知中学习类人的局部路径规划策略,智能完成拍照任务。
-
公开(公告)号:CN113269329B
公开(公告)日:2024-03-19
申请号:CN202110484030.4
申请日:2021-04-30
Applicant: 北京控制工程研究所
IPC: G06N20/00 , G06N3/006 , G06N3/0442 , G06N3/092
Abstract: 一种多智能体分布式强化学习方法,包括多智能体组织形式、智能体网络设计和训练方法。通过强化学习的方式实现整个网络系统的自适应网络服务,解决网络的分布式自主覆盖、目标追踪、缺位补充等高层次协同操作背后的关键技术,提升整个系统的综合感知保障能力和自愈合能力,使得整个系统具备极强的自组织、自配置和自管理能力,具备自我防护、系统修复和重构能力,以应对外部环境的变化。
-
公开(公告)号:CN111695195B
公开(公告)日:2023-07-18
申请号:CN202010413117.8
申请日:2020-05-15
Applicant: 北京控制工程研究所
IPC: G06F30/15 , G06F30/27 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06N3/09 , G06F119/14
Abstract: 本发明涉及一种基于长短时间记忆网络的空间物理运动体建模方法,涉及空间物理运动体建模技术领域;包括如下步骤:步骤一、建立第一全连接神经网络;步骤二、建立第二全连接神经网络;步骤三、建立第三全连接神经网络;步骤四、建立第一长短时间记忆网络和第二长短时间记忆网络;步骤五、根据步骤一至步骤四建立动力学模型网络;步骤六、根据状态量St和控制量Ct对步骤五中的动力学模型网络进行网络训练;步骤七、步骤七、重复步骤六,直至动力学模型网络收敛,完成对动力学模型网络修正;本发明采用离线训练和在线微调相结合的训练策略,实现弹道和飞行状态的在线预测,从而为后续高精度制导和高稳定控制提供依据。
-
公开(公告)号:CN115892514A
公开(公告)日:2023-04-04
申请号:CN202211321292.X
申请日:2022-10-26
Applicant: 北京控制工程研究所
Abstract: 一种面向空间轨道博弈的阶梯化智能生成方法,包括:根据空间轨道博弈任务,为红方航天器设置即时奖励函数;为红方航天器设置策略网络及价值网络;设置强化学习算法的超参数;依据科目一的设计准则,搭建第一数字仿真环境;开展航天器智能决策模型的学习训练,得到第一航天器决策模型;搭建第二数字仿真环境;加载第一航天器决策模型,开展学习训练,得到第二航天器决策模型;依据科目三的设计准则,搭建第三数字仿真环境;加载第二航天器决策模型,得到第三航天器决策模型;利用第三航天器决策模型,根据从环境中获得的观测量,生成航天器速度增量进行轨道控制,进而开展空间轨道博弈任务。
-
公开(公告)号:CN115712305A
公开(公告)日:2023-02-24
申请号:CN202211321605.1
申请日:2022-10-26
Applicant: 北京控制工程研究所
IPC: G05D1/08
Abstract: 一种静默协同下多航天器协同轨道博弈控制方法,包括:(1)选取被护卫航天器为参考点,建立CW轨道相对运动学模型及坐标系;(2)初始化并预设2Q颗在轨博弈航天器的参数;红方航天器和蓝方航天器数量相等;(3)为红蓝双方航天器设置即时奖励函数;(4)为红蓝双方航天器设置策略网络及价值网络;(5)设置多智能体强化学习算法的超参数;(6)对红蓝双方策略网络及价值网络进行左右互搏学习训练,根据红蓝双方策略网络给出的速度增量分别对红蓝双方航天器进行轨道控制,完成左右互搏学习训练后获得自主变轨博弈策略;(7)在静默状态下,多航天器利用自主变轨博弈策略对被护卫航天器进行护卫。
-
-
公开(公告)号:CN115205393A
公开(公告)日:2022-10-18
申请号:CN202210617856.8
申请日:2022-06-01
Applicant: 北京控制工程研究所
Abstract: 本发明公开了一种序列拨推采样归置策略迭代生成学习方法,用于在有限的工作空间、丰富的碰撞和高度耦合的情况下生成连续的推送动作,将随机分散在有限容器内的任意形状的物体自主归置,从而为未来的未知物体挤出尽可能多的空间,自主实现最大化装箱。本方法采用任务和运动规划思想,将任务学习抽象为一个两层问题。高层任务规划使用基于近端策略优化(PPO)的强化学习进行顺序推送决策。在底层运动规划中,采用传统的轨迹线性规划方法结合碰撞检测生成机器人推送操作。本方法能够以高效灵活的方式排列未知对象,同时将策略学习和机械臂控制解耦,从而具有更好的从仿真到现实世界的可移植性。
-
公开(公告)号:CN113377119A
公开(公告)日:2021-09-10
申请号:CN202110432096.9
申请日:2021-04-21
Applicant: 北京控制工程研究所
IPC: G05D1/08
Abstract: 本发明公开了一种基于能力模型的航天器任务推演方法和系统,该方法包括:进行态势评估,得到态势判定结果和基本能力指标集合;以n个1级期望态势为目标进行1级任务序列规划,并进行基于能力模型的多目标优化求解,得到1级基本能力指标集合;将各1级期望态势作为初始态势,各1级基本能力指标集合作为初始基本能力指标集合,重复任务序列规划和多目标优化求解的步骤,得到2级基本能力指标集合,依次类推,得到K级基本能力指标集合;选择最优态势发展支链,生成基于能力模型的任务推演结果。本发明解决了航天器实现对自身能力的快速评估、任务级指令的快速响应以及能力资源的快速分配问题,增强了对动态不确定场景的自主应变能力。
-
-
-
-
-
-
-
-
-