一种混合策略驱动的无人机模型预测控制方法

    公开(公告)号:CN115480487B

    公开(公告)日:2025-01-17

    申请号:CN202211296624.3

    申请日:2022-10-21

    Abstract: 本发明提出了一种混合策略驱动的无人机模型预测控制方法,首先,针对无人机执行复杂任务的未知动态环境特点将复杂任务分解为两个目标较为简单的子任务,并设计一种模型预测控制器,根据实时环境的感知信息与对自身状态的估计信息,给出两个子任务代价函数混合的比例系数,使无人机能根据自身与环境的状态变化在子任务间实时切换;通过迭代搜索方式对策略参数进行更新,使策略给出的混合比例系数在任务要求下达到最优;根据无人机对实时环境与自身状态的感知、估计,快速给出较优的子任务代价函数混合比例系数,对无人机在未知环境下执行复杂任务的进一步研究有着重要意义。

    一种数据驱动下非线性集群无人系统安全协同控制方法及装置

    公开(公告)号:CN119105334A

    公开(公告)日:2024-12-10

    申请号:CN202411153912.2

    申请日:2024-08-21

    Abstract: 本发明属于非线性协同控制技术领域,具体涉及一种数据驱动下非线性集群无人系统安全协同控制方法及装置。该方法包括步骤:S100,针对非线性集群无人系统,设计基于反馈增益矩阵的分布式状态反馈控制器,基于所述控制器构造等价闭环系统;S200,通过离线实验获取非线性集群无人系统的输入数据和状态数据,利用所述输入数据和状态数据实现所述等价闭环系统的非参数化表示;S300,将状态约束转化为对闭环系统吸引域的限制,基于所述闭环系统的参数化表示计算分布式反馈增益矩阵,进而获得状态反馈控制器实现对所述非线性集群无人系统的数据驱动协同控制,避免系统中单体的状态进入危险区域。

    基于光滑化和动量技术的分布式随机非光滑优化方法

    公开(公告)号:CN118133936A

    公开(公告)日:2024-06-04

    申请号:CN202410149842.7

    申请日:2024-02-02

    Abstract: 本发明公开了基于光滑化和动量技术的分布式随机非光滑优化方法,能够解决分布式环境下具有约束和随机因素的复合非光滑优化问题,该方法应具有更快的收敛速率、更低的计算复杂度、更小的存储开销。具体包括:使用基于光滑化和动量技术的分布式非光滑迭代算法对所有智能体进行循环处理,并给出迭代算法的初始状态设置、步长设置、光滑化参数的建议范围等;给定算法的效能衡量标准,在迭代变量优化完成后根据衡量标准绘制聚类对比结果。本发明的算法适用于具有非光滑项的组合优化问题,包括但不限于机器学习中的聚类问题、LASSO回归问题以及传感器网络的压缩感知问题等,适用于实际的具有高维复杂约束的大规模分布式非光滑优化应用场景。

    基于强化学习的多车合作式持续监控系统轨迹规划方法

    公开(公告)号:CN118034055A

    公开(公告)日:2024-05-14

    申请号:CN202410246191.3

    申请日:2024-03-05

    Abstract: 本发明公开了基于多智能体强化学习的多车系统合作式持续监控的轨迹规划方法,属于机器人智能决策与控制领域。首先构建面向目标区域合作式持续监控的多车轨迹规划问题的马尔科夫决策过程模型;引入栅格地图的发现度函数量化地图的搜索程度,并将其用于设计无人车合作式持续监控的状态空间,并设计动作空间和奖励函数;建立策略网络和评价网络;再基于多智能体强化学习算法,在无人车每前进一步后训练更新策略网络和评价网络,直至二者收敛;最终得到多无人车系统持续监控的策略网络。本发明基于无人车系统之间多车的分布式交互估计发现度地图,使该系统能够以较低地通信成本充分利用多车信息,解决合作方式下的轨迹规划问题,实现对目标监控区域尽可能多次的全覆盖。

    基于随机Transformer模型的有模型深度强化学习方法

    公开(公告)号:CN117454965A

    公开(公告)日:2024-01-26

    申请号:CN202311173801.3

    申请日:2023-09-12

    Abstract: 本发明公开了基于随机Transformer模型的有模型深度强化学习方法,涉及强化学习技术领域。首先,首先使用分类分布的变分自动编码器将高维的环境数据编码为低维隐空间上的随机变量。其次,利用Transformer作为世界模型在低维的隐变量空间上实现对环境变化规律的建模,该世界模型具有仿真原始环境的能力,可以通过自回归的方式生成观察以及奖励。最后利用策略梯度算法在世界模型上进行智能体的训练。最终得到智能体性能、计算效率等方面均表现出色的有模型强化学习算法,对强化学习在现实环境中的高效部署具有非常重要的意义。

    分布式柔性模糊系统暂态性能预测及其调度方法

    公开(公告)号:CN117289658A

    公开(公告)日:2023-12-26

    申请号:CN202310644502.7

    申请日:2023-06-02

    Abstract: 本发明公开的分布式柔性模糊系统暂态性能预测及其调度方法,属于生产调度领域。本发明对分布式柔性生产系统进行系统建模,并在系统建模的基础上实现对分布式柔性生产系统的高精度批次完成时间定量解析预测。本发明具有对分布式柔性模糊系统暂态性能预测精度高和效率高的优点。本发明在所述一种分布式柔性模糊系统暂态性能预测方法基础上,根据对分布式柔性生产系统的高精度批次完成时间定量解析预测结果,将不同生产场景分类为最优、中等、最差三种场景,并构建接受度准则,基于接受度准则改进遗传算法,根据改进遗传算法进行分布式柔性模糊系统的生产调度,提高生产调度的精准度和效率,节约生产能源。

    一种应对切换虚假数据注入攻击的数据驱动控制方法

    公开(公告)号:CN117201180A

    公开(公告)日:2023-12-08

    申请号:CN202311340026.6

    申请日:2023-10-17

    Abstract: 本发明公开了一种应对切换虚假数据注入攻击的数据驱动控制方法,涉及信息物理系统安全领域,在离线阶段收集未受攻击的输入‑状态数据,利用攻击者的能量上界和系统的噪声上界构造原始集合;在线运行阶段,实时收集系统的状态和输入,结合离线原始集合,通过求解一个半正定规划问题,得到当前时刻的控制增益,从而实现系统在一定攻击强度下的稳定运行;本发明无需预先的系统辨识,只需要数据采样,就可以实现弹性控制器的设计,在这一弹性控制器的作用下,受攻击系统能够实现指数稳定。

    一种基于深度强化学习的多无人机协同场源搜索轨迹规划方法

    公开(公告)号:CN117193372A

    公开(公告)日:2023-12-08

    申请号:CN202311329916.7

    申请日:2023-10-13

    Abstract: 本发明提出一种基于深度强化学习的多无人机协同场源搜索轨迹规划方法,属于机器人智能决策与控制领域。首先构建多无人机在多个信号的复合场场源搜索任务下的轨迹规划问题,并提出基于单个信号场搜索与多智能体一致性算法的轨迹规划方法;然后构建单个信号场场源搜索任务下单个无人机轨迹规划问题的马尔科夫决策过程模型,分别设计状态变量,控制变量,转移模型和奖励函数;然后建立策略网络和评价网络,并在无人机每前进一步后训练更新策略网络和评价网络,直至二者收敛;将基于强化学习训练得到的策略与多智能体的一致性项叠加,最终得到多无人机搜索多个信号的复合场场源的轨迹规划策略。

Patent Agency Ranking