一种基于多智能体深度强化学习与最小二乘的定位方法

    公开(公告)号:CN114578335B

    公开(公告)日:2024-08-16

    申请号:CN202210207643.8

    申请日:2022-03-03

    IPC分类号: G01S11/06 G06F17/18

    摘要: 本发明属于无人机辅助轨迹定位的方法,具体涉及一种基于多智能体深度强化学习与最小二乘算法的定位方法。本发明建模一个无人机群与目标机器人相互通信的场景,利用有标签的无人机群和目标机器人的轨迹数据,以及二者之间的接收信号强度进行定位。首先使用最小二乘算法对目标位置进行定位,然后基于多智能体深度强化学习算法对无人机群进行自主定位,同时评估对目标位置的估计。训练过程中,使用深度神经网络处理高维状态输入,借助标签位置信息计算奖赏值,并考虑到多个智能体之间的异构性,进行了相关的仿真实验。通过训练可以得到一个自适应的网络模型,对处理高维异构数据也有一定的鲁棒性。因此,本发明是一种良好的定位替代技术。

    一种基于层级化元迁移的小样本雷达目标识别方法

    公开(公告)号:CN115345322B

    公开(公告)日:2023-02-07

    申请号:CN202211276348.4

    申请日:2022-10-19

    摘要: 本发明属于目标识别技术领域,具体的说是涉及一种基于小样本的层级化元迁移雷达目标识别方法。本发明基于注意力机制提取特征,在特征级、样本级、和任务级上的层级化深度知识迁移,以寻求一个嵌入空间使得样本接近同类目标的类别原子,远离于其他类目标的类别原子。其中,在特征级设计了基于注意力机制的特征编码器,充分挖掘样本全局性的域不变特征,以克服样本在数据分布上的域差异问题;在样本级设计原子编码器,生成更加稳定的类别原子,以避免离群样本的影响;在任务级,设计元学习器累积训练任务的学习经验迁移至新任务,培养模型跨任务知识迁移的能力,实现元迁移目标识别。本发明的目标识别方法是一种智能的目标识别方法。

    一种基于层级化元迁移的小样本雷达目标识别方法

    公开(公告)号:CN115345322A

    公开(公告)日:2022-11-15

    申请号:CN202211276348.4

    申请日:2022-10-19

    摘要: 本发明属于目标识别技术领域,具体的说是涉及一种基于小样本的层级化元迁移雷达目标识别方法。本发明基于注意力机制提取特征,在特征级、样本级、和任务级上的层级化深度知识迁移,以寻求一个嵌入空间使得样本接近同类目标的类别原子,远离于其他类目标的类别原子。其中,在特征级设计了基于注意力机制的特征编码器,充分挖掘样本全局性的域不变特征,以克服样本在数据分布上的域差异问题;在样本级设计原子编码器,生成更加稳定的类别原子,以避免离群样本的影响;在任务级,设计元学习器累积训练任务的学习经验迁移至新任务,培养模型跨任务知识迁移的能力,实现元迁移目标识别。本发明的目标识别方法是一种智能的目标识别方法。

    一种面向异构环境的基于深度强化学习的轨迹定位方法

    公开(公告)号:CN114727229A

    公开(公告)日:2022-07-08

    申请号:CN202210325226.3

    申请日:2022-03-30

    摘要: 本发明属于室内定位技术领域,具体是涉及一种面向异构环境的基于深度强化学习的轨迹定位方法。本发明充分利用了环境中的观测和智能体自身的历史动态信息,以智能体的位置、环境中具有设备异构性的RSS向量和过去n个时刻的历史动作为状态,用于动作的选择。再基于近场条件选择强于RSS阈值对应的APs,以构成选定的APs集合,再根据集合的大小计算最终奖赏值。依据MDP中设计的各要素对智能体的位置进行估计,并以奖赏值为学习导向基于经验重放机制和目标网络进行深度强化学习算法的迭代训练。本发明基于路径损耗模型得到具有设备异构性的仿真RSS数据,实验结果证明本发明所提方法能够实现较高的定位精度,并对处理异构RSS数据也具有一定的鲁棒性。

    一种基于多智能体深度强化学习与最小二乘的定位方法

    公开(公告)号:CN114578335A

    公开(公告)日:2022-06-03

    申请号:CN202210207643.8

    申请日:2022-03-03

    IPC分类号: G01S11/06 G06F17/18

    摘要: 本发明属于无人机辅助轨迹定位的方法,具体涉及一种基于多智能体深度强化学习与最小二乘算法的定位方法。本发明建模一个无人机群与目标机器人相互通信的场景,利用有标签的无人机群和目标机器人的轨迹数据,以及二者之间的接收信号强度进行定位。首先使用最小二乘算法对目标位置进行定位,然后基于多智能体深度强化学习算法对无人机群进行自主定位,同时评估对目标位置的估计。训练过程中,使用深度神经网络处理高维状态输入,借助标签位置信息计算奖赏值,并考虑到多个智能体之间的异构性,进行了相关的仿真实验。通过训练可以得到一个自适应的网络模型,对处理高维异构数据也有一定的鲁棒性。因此,本发明是一种良好的定位替代技术。

    一种基于深度知识集成的领域自适应目标识别方法

    公开(公告)号:CN113657541A

    公开(公告)日:2021-11-16

    申请号:CN202110987414.8

    申请日:2021-08-26

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明属于目标识别技术领域,具体的说是涉及一种基于深度知识集成的领域自适应目标识别方法。本发明实现了特征级和决策级的深度知识集成。在特征级设计公有映射矩阵和特有映射矩阵实现知识集成,提升目标识别性能的鲁棒性;其中,公有映射矩阵充分挖掘了异构特征的公有知识,特有映射矩阵保留了不同特征的特有知识。在决策级设计特征权重量化不同特征的重要程度,同时利用目标域样本通过在线学习更新特征权重,克服不同领域的数据分布差异,实现领域自适应目标识别。因此本发明提出的基于深度知识集成的领域自适应目标识别方法是一种智能的领域自适应目标识别方法。

    一种基于深度知识集成的领域自适应目标识别方法

    公开(公告)号:CN113657541B

    公开(公告)日:2023-10-10

    申请号:CN202110987414.8

    申请日:2021-08-26

    摘要: 本发明属于目标识别技术领域,具体的说是涉及一种基于深度知识集成的领域自适应目标识别方法。本发明实现了特征级和决策级的深度知识集成。在特征级设计公有映射矩阵和特有映射矩阵实现知识集成,提升目标识别性能的鲁棒性;其中,公有映射矩阵充分挖掘了异构特征的公有知识,特有映射矩阵保留了不同特征的特有知识。在决策级设计特征权重量化不同特征的重要程度,同时利用目标域样本通过在线学习更新特征权重,克服不同领域的数据分布差异,实现领域自适应目标识别。因此本发明提出的基于深度知识集成的领域自适应目标识别方法是一种智能的领域自适应目标识别方法。