一种基于估计偏差平均的四基站UWB平面定位算法

    公开(公告)号:CN112566021A

    公开(公告)日:2021-03-26

    申请号:CN202011396417.6

    申请日:2020-12-04

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于估计偏差平均的四基站UWB平面定位算法,其包括如下步骤:定位标签向四个基站轮询获取距离数据,检查距离数据的可靠性,计算出多组位置参数和位置参数关于距离数据的梯度的模值,根据梯度模值设置每组位置参数的权重,使最终估计结果表达式对每一个基站的距离数据的偏导相等,该方案抑制测量数据波动对最终定位效果的干扰,提升了定位的准确度。

    人群感知机器人的多目标强化学习导航方法

    公开(公告)号:CN116384477A

    公开(公告)日:2023-07-04

    申请号:CN202310185203.1

    申请日:2023-03-01

    Abstract: 本发明公开人群感知机器人的多目标强化学习导航方法。首先,初始化多目标强化学习参数。然后,采集得到当前环境下智能体的状态信息,并对数据进行相应的预处理。其次,将处理好的智能体的状态信息送入到价值网络输出智能体的决策动作,根据不同的目标奖励函数计算累计奖励对智能体进行评价,利用多目标强化学习算法进行价值网络参数更新。最后,判断是否到达最大训练次数,通过不断地试错学习得到良好的导航表现。本发明提出一种端到端的机器人导航框架,实现针对动态权重下多个目标间的权衡,提高了机器人在密集人群场所中的导航性能表现。

    一种四旋翼无人机积分补偿确定性策略梯度控制方法

    公开(公告)号:CN112034872A

    公开(公告)日:2020-12-04

    申请号:CN202010895952.X

    申请日:2020-08-31

    Applicant: 东南大学

    Abstract: 本专利公开了一种四旋翼无人机积分补偿确定性策略梯度控制方法。本发明使用深度神经网络对四旋翼无人机的控制器进行表示,将四旋翼无人机的运动状态通过深度神经网络直接映射到四个电机的控制指令,使用机器学习算法根据奖励反馈信号对深度神经网络进行训练,最终获得满足控制需求的控制器。本方法可以直接使用带有复杂非线性特性的四旋翼无人机数学模型进行训练,通过引入积分补偿机制结合确定性策略梯度算法进行训练,可以提高训练得到的控制器的鲁棒性和精确性。

    基于势垒函数的时变延迟输出反馈控制方法和系统

    公开(公告)号:CN119472684A

    公开(公告)日:2025-02-18

    申请号:CN202411646790.0

    申请日:2024-11-18

    Abstract: 本发明提出了一种基于势垒函数的时变延迟输出反馈控制方法和系统,解决了无人车编队与超广角摄像机通信时的通信延迟和视场(FOV)约束问题。首先,利用二阶振荡器和输出反馈控制器通过交换控制量来反馈相邻车辆的位置和方向,解决了超广角摄像机位置计算中的时变延迟难题。其次,针对摄像机感知目标辐射范围有限的问题,采用FOV约束势函数对滑模曲面进行优化设计,应用李雅普诺夫方法分析了闭环控制系统的稳定性。最后,通过处理两种不同初始情况下的通信延迟和FOV约束问题,通过仿真实验验证了共识方案的有效性。

    基于强化学习的规避静态恶意软件检测器的对抗攻击方法

    公开(公告)号:CN119249418A

    公开(公告)日:2025-01-03

    申请号:CN202411219418.1

    申请日:2024-09-02

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于强化学习的规避静态恶意软件检测器的对抗攻击方法,通过重新设计强化学习算法中智能体所使用的状态空间和行动空间,改善以往工作中对抗样本生成效率低的问题。首次将对抗样本功能是否保留的验证操作作为样本生成过程的一个组成部分纳入该框架,从而大大提高了验证效率。我们选择了多种当前流行的静态恶意软件检测器作为受害者模型,以评估攻击框架的有效性和鲁棒性。通过对检测器的可解释性和攻击结果的分析,阐明了这些检测器潜在的漏洞。最后,采用了一种基于迁移学习的策略提炼方法,以增强该框架攻击的泛化性。通过学习针对不同检测器训练后的专家智能体的知识,该框架针对不同类型的检测器均可以发起有效的攻击。

    一种基于图像和文本的多模态商品匹配方法

    公开(公告)号:CN115018010B

    公开(公告)日:2024-08-20

    申请号:CN202210809470.7

    申请日:2022-07-11

    Applicant: 东南大学

    Abstract: 一种基于图像和文本的多模态商品匹配方法,该方法旨在利用商品封面的图像信息和商品标题中的文本信息,找出相匹配的商品;其具体步骤:首先,使用度量学习的方法,使网络学习到具有判别性的特征;其次,分别通过图像和文本网络提取商品特征;再次,从图像、文本和多模态三个角度计算样本间特征的余弦距离,采用查询扩展的方法,实现对匹配结果的重排;最后,设置动态阈值,实现多模态结果的融合,并将满足阈值条件的样本加入到最终匹配结果中。本发明所涉及的神经网络结构和后处理方法,能够有效解决单一模态中存在的少匹配和误匹配问题。在满足匹配精确性的同时,显著提高商品的召回率。

    一种四旋翼无人机积分补偿确定性策略梯度控制方法

    公开(公告)号:CN112034872B

    公开(公告)日:2023-01-17

    申请号:CN202010895952.X

    申请日:2020-08-31

    Applicant: 东南大学

    Abstract: 本专利公开了一种四旋翼无人机积分补偿确定性策略梯度控制方法。本发明使用深度神经网络对四旋翼无人机的控制器进行表示,将四旋翼无人机的运动状态通过深度神经网络直接映射到四个电机的控制指令,使用机器学习算法根据奖励反馈信号对深度神经网络进行训练,最终获得满足控制需求的控制器。本方法可以直接使用带有复杂非线性特性的四旋翼无人机数学模型进行训练,通过引入积分补偿机制结合确定性策略梯度算法进行训练,可以提高训练得到的控制器的鲁棒性和精确性。

    一种基于智能组件的移动机器人导航与控制方法

    公开(公告)号:CN110658816A

    公开(公告)日:2020-01-07

    申请号:CN201910920606.X

    申请日:2019-09-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于智能组件的移动机器人导航与控制方法,首先建立用于机器人导航与控制的智能组件库,其中包括用于移动机器人环境感知、路径规划和驱动控制的多种智能组件。然后根据机器人的传感器配置、任务需求和驱动形式选择相应的一组智能组件,并且通过智能组件融合技术完成移动机器人的导航与控制任务。根据任务执行的效果,可以自动调节每个智能组件的算法参数,进一步改进执行效果。本方法可以方便地应用于搭载各种传感器和具有不同驱动形式的移动机器人,在使用过程中还可以方便地改变传感器配置、更换导航算法,并且无需重新设计整套导航与控制程序,具有良好的灵活性和通用性。

    基于拓扑图结构和深度自注意力网络的行人轨迹预测方法

    公开(公告)号:CN115082896B

    公开(公告)日:2024-08-20

    申请号:CN202210741506.2

    申请日:2022-06-28

    Applicant: 东南大学

    Abstract: 基于拓扑图结构和深度自注意力网络的行人轨迹预测方法,利用图注意力网络和基于拓扑图的深度自注意力网络提取分别行人运动轨迹中的局部和全局空间交互特征,随后利用原始深度自注意力网络提取时间序列特征。为了模拟行人运动轨迹的固有不确定性和多模态特性,本发明通过在全连接网络解码器中引入高斯噪声的方式来拓展行人运动轨迹的探索空间。为了进一步提高轨迹探索空间及平滑性,将轨迹送入轨迹矫正模块进行矫正。其采用的图神经网络和基于图的深度自注意力网络相较于其他方法更能充分关注到行人运动轨迹中的各种空间交互模式,如并行,潜在避障等。相比于其他行人轨迹预测方法,本发明的社会性交互特征提取能力和多模态探索能力更加突出有效。

    一种基于时空平滑度分析的水下机器人强化学习控制方法

    公开(公告)号:CN116880189A

    公开(公告)日:2023-10-13

    申请号:CN202310871124.6

    申请日:2023-07-17

    Applicant: 东南大学

    Abstract: 本发明提供了一种基于时空平滑度分析的水下机器人强化学习控制方法,通过结合时间平滑度和空间平滑度分析,效削弱电机信号中的震荡现象,通过在强化学习基于神经网络的控制器中引入积分补偿器,补偿由于值函数拟合误差带来的稳态误差,从而保证控制的稳定性和精确度。另外,本发明在控制过程中对水下机器人的动力学模型进行动态拟合,并通过动力学模型获得用于强化学习训练的经验数据,通过扩充训练数据的方法提高强化学习算法的学习效率。

Patent Agency Ranking