-
公开(公告)号:CN112434792A
公开(公告)日:2021-03-02
申请号:CN202011278974.8
申请日:2020-11-16
Applicant: 东南大学
Abstract: 本专利公开了一种用于多智能体系统通信和控制的强化学习方法。本方法针对通过一定拓扑结构的通信网络发送和接收消息进行信息共享的多智能体系统,给出了一种强化学习算法,使多智能体系统能够通过训练,在每个智能体上构建通信策略和控制策略,使智能体从传感设备的高维原始输入中提取有效的低维通信信息,从而使整个多智能体系统能够实现高效的信息共享和协同控制。该方法降低了带有复杂动态和高维观测的多智能体系统通信和控制策略设计的复杂程度,同时也降低了智能体之间的通信负荷。
-
公开(公告)号:CN112034711A
公开(公告)日:2020-12-04
申请号:CN202010895943.0
申请日:2020-08-31
Applicant: 东南大学
IPC: G05B13/04
Abstract: 本专利公开了一种基于深度强化学习的无人艇抗海浪干扰控制方法。本发明采用的技术方案是使用深度强化学习算法构建无人艇的控制器,利用深度神经网络将无人艇的运动状态和海浪特性映射到无人艇的推进器和方向舵的控制量,使用深度强化学习算法,根据历史实验数据对深度神经网络进行训练。首先在仿真环境中基于无人艇的简化模型和海浪干扰模型对控制器进行初步训练,然后在实际海域中进行实体无人艇的实验和训练,使控制器依据真实的无人艇和海浪动态特性进行在线学习,最终得到效果良好的无人艇抗海浪干扰控制器。
-
公开(公告)号:CN117193293A
公开(公告)日:2023-12-08
申请号:CN202311057875.0
申请日:2023-08-22
Applicant: 东南大学
Abstract: 一种基于动作空间安全映射的赛车强化学习自动驾驶方法,本发明采用的技术方案是使用神经网络建立赛车的自动驾驶控制器,输入赛车自身的运动状态数据和前方赛道的数据,输出对应的油门/刹车控制量和方向盘控制量。根据赛车的动力学模型,建立动作空间安全映射函数,将可能导致车辆进入危险状态的神经网络输出量转化为安全的控制量再输入赛车的控制系统。利用强化学习算法,根据奖励反馈信号对神经网络进行训练,不断更新神经网络参数,最终获得优化的赛车自动驾驶策略。
-
公开(公告)号:CN116597161A
公开(公告)日:2023-08-15
申请号:CN202310539070.3
申请日:2023-05-15
Applicant: 东南大学
Abstract: 一种基于动态匹配和绝对中位差的线特征匹配方法,包括如下步骤:1)接收RGB‑D相机采集的RGB帧作为视觉输入图像;2)使用EDLines线检测器进行线特征提取;3)通过端点对线特征进行参数化;4)基于离散关键点对参数化的线特征进行描述;5)使用动态规划算法对前后帧提取的线特征进行动态匹配;6)使用绝对中位差方法估算所有线特征匹配的位移变化标准差,并基于此对错误的或低质量的线匹配进行剔除。本发明能在遮挡,旋转以及外观改变的场景中,提取足够数量的且正确的线特征匹配。
-
公开(公告)号:CN112566021B
公开(公告)日:2023-04-18
申请号:CN202011396417.6
申请日:2020-12-04
Applicant: 东南大学
Abstract: 本发明涉及一种基于估计偏差平均的四基站UWB平面定位算法,其包括如下步骤:定位标签向四个基站轮询获取距离数据,检查距离数据的可靠性,计算出多组位置参数和位置参数关于距离数据的梯度的模值,根据梯度模值设置每组位置参数的权重,使最终估计结果表达式对每一个基站的距离数据的偏导相等,该方案抑制测量数据波动对最终定位效果的干扰,提升了定位的准确度。
-
公开(公告)号:CN110658816B
公开(公告)日:2022-10-25
申请号:CN201910920606.X
申请日:2019-09-27
Applicant: 东南大学
IPC: G05D1/02
Abstract: 本发明公开了一种基于智能组件的移动机器人导航与控制方法,首先建立用于机器人导航与控制的智能组件库,其中包括用于移动机器人环境感知、路径规划和驱动控制的多种智能组件。然后根据机器人的传感器配置、任务需求和驱动形式选择相应的一组智能组件,并且通过智能组件融合技术完成移动机器人的导航与控制任务。根据任务执行的效果,可以自动调节每个智能组件的算法参数,进一步改进执行效果。本方法可以方便地应用于搭载各种传感器和具有不同驱动形式的移动机器人,在使用过程中还可以方便地改变传感器配置、更换导航算法,并且无需重新设计整套导航与控制程序,具有良好的灵活性和通用性。
-
公开(公告)号:CN115082896A
公开(公告)日:2022-09-20
申请号:CN202210741506.2
申请日:2022-06-28
Applicant: 东南大学
Abstract: 基于拓扑图结构和深度自注意力网络的行人轨迹预测方法,利用图注意力网络和基于拓扑图的深度自注意力网络提取分别行人运动轨迹中的局部和全局空间交互特征,随后利用原始深度自注意力网络提取时间序列特征。为了模拟行人运动轨迹的固有不确定性和多模态特性,本发明通过在全连接网络解码器中引入高斯噪声的方式来拓展行人运动轨迹的探索空间。为了进一步提高轨迹探索空间及平滑性,将轨迹送入轨迹矫正模块进行矫正。其采用的图神经网络和基于图的深度自注意力网络相较于其他方法更能充分关注到行人运动轨迹中的各种空间交互模式,如并行,潜在避障等。相比于其他行人轨迹预测方法,本发明的社会性交互特征提取能力和多模态探索能力更加突出有效。
-
公开(公告)号:CN115018010A
公开(公告)日:2022-09-06
申请号:CN202210809470.7
申请日:2022-07-11
Applicant: 东南大学
IPC: G06K9/62 , G06Q30/06 , G06V10/74 , G06V10/75 , G06V10/764
Abstract: 一种基于图像和文本的多模态商品匹配方法,该方法旨在利用商品封面的图像信息和商品标题中的文本信息,找出相匹配的商品;其具体步骤:首先,使用度量学习的方法,使网络学习到具有判别性的特征;其次,分别通过图像和文本网络提取商品特征;再次,从图像、文本和多模态三个角度计算样本间特征的余弦距离,采用查询扩展的方法,实现对匹配结果的重排;最后,设置动态阈值,实现多模态结果的融合,并将满足阈值条件的样本加入到最终匹配结果中。本发明所涉及的神经网络结构和后处理方法,能够有效解决单一模态中存在的少匹配和误匹配问题。在满足匹配精确性的同时,显著提高商品的召回率。
-
公开(公告)号:CN112034711B
公开(公告)日:2022-06-03
申请号:CN202010895943.0
申请日:2020-08-31
Applicant: 东南大学
IPC: G05B13/04
Abstract: 本专利公开了一种基于深度强化学习的无人艇抗海浪干扰控制方法。本发明采用的技术方案是使用深度强化学习算法构建无人艇的控制器,利用深度神经网络将无人艇的运动状态和海浪特性映射到无人艇的推进器和方向舵的控制量,使用深度强化学习算法,根据历史实验数据对深度神经网络进行训练。首先在仿真环境中基于无人艇的简化模型和海浪干扰模型对控制器进行初步训练,然后在实际海域中进行实体无人艇的实验和训练,使控制器依据真实的无人艇和海浪动态特性进行在线学习,最终得到效果良好的无人艇抗海浪干扰控制器。
-
-
-
-
-
-
-
-