Patent search ap:("北京理工大学") AND inv:"冯肇晗" Page 1

1.

发明公开
无人机高速导航与避障方法、系统、终端及存储介质有权

公开(公告)号：CN118466557A

公开(公告)日：2024-08-09

申请号：CN202410917392.1

申请日：2024-07-10

Applicant: 北京理工大学

Inventor： 王钢 , 肖伟 , 冯肇晗 , 李卓 , 孙健 , 陈杰

IPC: G05D1/46 , G05D1/622

Abstract: 本发明公开了无人机高速导航与避障方法、系统、终端及存储介质，涉及无人机控制技术领域。本发明中的神经网络策略可以根据无人机的观测信息，输出有效的执行动作。其训练方法为：通过复杂度随机变化的仿真环境获取无人机的仿真观测信息；通过神经网络策略采样仿真执行动作；通过马尔可夫决策模型计算下一时刻的仿真状态信息和当前时刻的及时奖励，包括路径进度奖励、安全奖励、终端奖励；根据及时奖励计算折扣奖励，并利用折扣奖励优化神经网络策略。本发明通过设置三种奖励，鼓励无人机按照航线快速前进，避免碰撞风险，更快速有效地完成任务。训练采用复杂度可随机变化的仿真环境，也有效提高了神经网络策略的泛化能力。

2.

发明授权
一种混合策略驱动的无人机模型预测控制方法有权

公开(公告)号：CN115480487B

公开(公告)日：2025-01-17

申请号：CN202211296624.3

申请日：2022-10-21

Applicant: 北京理工大学

Inventor： 王钢 , 冯肇晗 , 肖伟 , 周子煜 , 翁博熙 , 孙健 , 陈杰

IPC: G05B13/04 , G05D1/46

Abstract: 本发明提出了一种混合策略驱动的无人机模型预测控制方法，首先，针对无人机执行复杂任务的未知动态环境特点将复杂任务分解为两个目标较为简单的子任务，并设计一种模型预测控制器，根据实时环境的感知信息与对自身状态的估计信息，给出两个子任务代价函数混合的比例系数，使无人机能根据自身与环境的状态变化在子任务间实时切换；通过迭代搜索方式对策略参数进行更新，使策略给出的混合比例系数在任务要求下达到最优；根据无人机对实时环境与自身状态的感知、估计，快速给出较优的子任务代价函数混合比例系数，对无人机在未知环境下执行复杂任务的进一步研究有着重要意义。

3.

发明公开
一种混合策略驱动的无人机模型预测控制方法有权

公开(公告)号：CN115480487A

公开(公告)日：2022-12-16

申请号：CN202211296624.3

申请日：2022-10-21

Applicant: 北京理工大学

Inventor： 王钢 , 冯肇晗 , 肖伟 , 周子煜 , 翁博熙 , 孙健 , 陈杰

IPC: G05B13/04 , G05D1/10

Abstract: 本发明提出了一种混合策略驱动的无人机模型预测控制方法，首先，针对无人机执行复杂任务的未知动态环境特点将复杂任务分解为两个目标较为简单的子任务，并设计一种模型预测控制器，根据实时环境的感知信息与对自身状态的估计信息，给出两个子任务代价函数混合的比例系数，使无人机能根据自身与环境的状态变化在子任务间实时切换；通过迭代搜索方式对策略参数进行更新，使策略给出的混合比例系数在任务要求下达到最优；根据无人机对实时环境与自身状态的感知、估计，快速给出较优的子任务代价函数混合比例系数，对无人机在未知环境下执行复杂任务的进一步研究有着重要意义。

4.

发明授权
无人机高速导航与避障方法、系统、终端及存储介质有权

公开(公告)号：CN118466557B

公开(公告)日：2024-11-26

申请号：CN202410917392.1

申请日：2024-07-10

Applicant: 北京理工大学

Inventor： 王钢 , 肖伟 , 冯肇晗 , 李卓 , 孙健 , 陈杰

IPC: G05D1/46 , G05D1/622

Abstract: 本发明公开了无人机高速导航与避障方法、系统、终端及存储介质，涉及无人机控制技术领域。本发明中的神经网络策略可以根据无人机的观测信息，输出有效的执行动作。其训练方法为：通过复杂度随机变化的仿真环境获取无人机的仿真观测信息；通过神经网络策略采样仿真执行动作；通过马尔可夫决策模型计算下一时刻的仿真状态信息和当前时刻的及时奖励，包括路径进度奖励、安全奖励、终端奖励；根据及时奖励计算折扣奖励，并利用折扣奖励优化神经网络策略。本发明通过设置三种奖励，鼓励无人机按照航线快速前进，避免碰撞风险，更快速有效地完成任务。训练采用复杂度可随机变化的仿真环境，也有效提高了神经网络策略的泛化能力。

5.

发明公开
基于硬注意力增强的近端策略优化方法、终端及存储介质审中-实审

公开(公告)号：CN118690778A

公开(公告)日：2024-09-24

申请号：CN202410803426.4

申请日：2024-06-20

Applicant: 北京理工大学

Inventor： 王钢 , 冯肇晗 , 孙健 , 肖伟 , 李卓 , 窦丽华 , 陈杰

IPC: G06N3/006 , G06N20/00

Abstract: 本发明公开了基于硬注意力增强的近端策略优化方法、终端及存储介质，涉及人工智能与控制技术领域。本发明通过硬注意力模块对智能体的观测数据进行整理、排列以及筛选，有效降低系统状态空间复杂度和无关的冗余信息的干扰。另外还采用近端策略优化方法，通过基于全局信息的评价网络与决策网络进行交替迭代训练，评价网络可以对决策网络的习得策略进行准确、合理的评价，提高强化学习方法应用于复杂干扰环境下大规模多智能体协同任务时的学习效率、策略性能以及鲁棒性。从而解决现有技术中大规模多智能体系统状态维度爆炸、单个智能体观测受限的问题，实现在复杂干扰环境中执行大规模群体对抗任务。

Patent Agency Ranking