一种基于深度强化学习的多智能体路径规划方法

    公开(公告)号:CN113159432B

    公开(公告)日:2024-06-11

    申请号:CN202110468095.X

    申请日:2021-04-28

    Abstract: 本发明公开了一种基于深度强化学习的多智能体路径规划方法。该方法是一种分布式的路径规划方法,将单个智能体的局部观察信息输入神经网络,利用图神经网络传递智能体间信息,训练神经网络近似策略函数,从而输出移动策略。使用深度强化学习与模仿学习相结合的方法训练神经网络参数,使得回报函数收敛更快。在训练后可实现上千智能体规模下、四邻域2D栅格地图中较高的群体路径规划成功率,即为每个智能体在时间限制内成功规划出一条从起点至终点的无碰撞路线。且对地图尺寸、障碍物密度的变化适应性较强。

    一种基于RGB-D的实时避障系统

    公开(公告)号:CN113408353B

    公开(公告)日:2023-04-07

    申请号:CN202110542757.3

    申请日:2021-05-18

    Abstract: 本发明公开了一种基于RGB‑D的实时避障系统。该系统中,图形采集模块用于采集相机设备原始的深度信息以及RGB信息;标定模块用于标定地面背景,标定相机安装角度以获取地面信息以及相机安装角度信息;普通障碍物检测模块用于处理图像采集模块输出的信息提取出障碍物并输出障碍物的位置信息;验证模块用于二次判断障碍物是否为误检测;特殊障碍检测模块用于检测行人及其他智能移动机器人并输出具体位置信息;避障决策模块用于处理普通障碍物检测模块与障碍物检测模块输出的信息做出相应的避障策略;移动控制模块用于处理避障决策模块输出的避障策略控制机器人的移动实现避障功能。通过各模块配合,从而实现可靠、快速、高精度、低误检的实时避障系统。

    一种面向中文工业领域的知识实体识别方法及系统

    公开(公告)号:CN114780729A

    公开(公告)日:2022-07-22

    申请号:CN202210463257.5

    申请日:2022-04-28

    Abstract: 本发明公开了一种面向中文工业领域的知识实体识别方法及系统。本发明采用了特征性工业文本语料并对其做出手工标注作为模型的输入,利用2种不同的数据增强的方式对训练文本进行多特征处理后分别输入词嵌入层,对不同的嵌入特征向量利用叠加求均值的方式,采用卷积神经网络,针对对处理长文本的优势结合了膨胀卷积神经网络,并在卷积层后加入注意力设置训练权重。其中,改进膨胀卷积的网络结构来更好地扩展抽取长文本的特征时的感受视野。

    一种基于RGBD相机的仓储托盘检测与定位方法

    公开(公告)号:CN113409397A

    公开(公告)日:2021-09-17

    申请号:CN202110540461.8

    申请日:2021-05-18

    Abstract: 本发明公开了一种基于RGBD相机的仓储托盘检测与定位方法,该方法首先采集仓储托盘图片并建立训练数据集;将训练数据集输入YOLOV5模型进行训练;然后开启相机获取RGB图像和深度图像;使用训练好YOLOV5模型进行仓储托盘检测;在RGB图像中框选出托盘区域;最后深度图对齐RGB图像,获取托盘区域的深度距离信息;计算托盘相对于相机的位姿。本发明不需要进行敷设特征标签,不需要指定托盘颜色,与现有技术相比,具有实施简单、准确性高、鲁棒性强等特点,极大的提高了自动叉车的安全性和智能化水平。

    一种基于深度强化学习的多智能体路径规划方法

    公开(公告)号:CN113159432A

    公开(公告)日:2021-07-23

    申请号:CN202110468095.X

    申请日:2021-04-28

    Abstract: 本发明公开了一种基于深度强化学习的多智能体路径规划方法。该方法是一种分布式的路径规划方法,将单个智能体的局部观察信息输入神经网络,利用图神经网络传递智能体间信息,训练神经网络近似策略函数,从而输出移动策略。使用深度强化学习与模仿学习相结合的方法训练神经网络参数,使得回报函数收敛更快。在训练后可实现上千智能体规模下、四邻域2D栅格地图中较高的群体路径规划成功率,即为每个智能体在时间限制内成功规划出一条从起点至终点的无碰撞路线。且对地图尺寸、障碍物密度的变化适应性较强。

    一种基于激光雷达的单移动机器人室内定位方法

    公开(公告)号:CN112285725A

    公开(公告)日:2021-01-29

    申请号:CN202011076965.0

    申请日:2020-10-10

    Abstract: 本发明公开了一种基于激光雷达的单移动机器人室内定位方法,其利用装载激光雷达的移动机器人在室内移动并扫描的方式来定位室内反光板的位置。上层控制器为一个装载激光雷达的移动机器人规划室内的移动路径,并控制其移动至路径起点。移动机器人在原点建立全局坐标系,同时对其所在位置检测范围内的反光板进行扫描,并计算得到它们的全局坐标,然后在下一时刻对所在位置检测范围内的反光板进行扫描,计算检测范围内的反光板全局坐标,依次在每个时刻重复以上步骤,直到移动机器人运动至指定路径的终点,对记录的所有反光板全局坐标进行处理。本发明方法具有高度的灵活性,可以有效地解决室内定位精度低的问题,而且实施简单,具有非常好的应用性。

    一种面向多机器人充电策略的分布式求解方法

    公开(公告)号:CN112070341A

    公开(公告)日:2020-12-11

    申请号:CN202010723028.3

    申请日:2020-07-24

    Abstract: 本发明公开了一种面向多机器人充电策略的分布式求解方法,该方法以极小化所有要充电的机器人总耗时为目标,总耗时包括行驶时间、排队时间和充电时间。每个机器人在全局信息未知的情况下,利用自己获取到的通信范围内邻居机器人的位置、剩余电量信息,以及比自己优先级高的邻居机器人的充电策略等信息,基于自己充电耗时最少的原则,选择剩余电量容许可达的充电站,来实现近似最优解。本发明解决了多机器人在充电站拥堵充电的问题,有效缩短了整个多机器人充电系统的充电时间,大大的提高了机器人的充电效率。

    一种基于MADDPG和拍卖算法的雷达干扰资源分配方法

    公开(公告)号:CN119338208B

    公开(公告)日:2025-03-18

    申请号:CN202411880494.7

    申请日:2024-12-19

    Abstract: 本发明公开了一种基于MADDPG和拍卖算法的雷达干扰资源分配方法,该方法首先建立干扰对抗模型和雷达探测模型,基于干扰对抗模型,通过拍卖算法实现目标分配。其次建立干扰机的状态空间,包括自身信息、其他干扰机的信息和目标雷达信息。然后采用多智能体分解的方法将每一个干扰机分解为三个决策智能体,并建立每一个决策智能体的动作空间。最后基于状态空间和动作空间,结合拍卖算法中目标分配的分配矩阵,通过MADDPG算法实现干扰资源分配。本发明对干扰机干扰资源进行动态、实时的分配,实现了干扰机在高维动作空间中的干扰资源实时高效的分配。

Patent Agency Ranking