-
公开(公告)号:CN110879531B
公开(公告)日:2022-06-24
申请号:CN201911154069.9
申请日:2019-11-22
申请人: 北京理工大学重庆创新中心 , 北京理工大学
IPC分类号: G05B13/04
摘要: 本发明公开了一种随机扰动系统的数据驱动自适应优化控制方法及介质,方法包括问题描述部分、数据驱动最优状态观测器的设计部分和随机扰动系统的异策略数据驱动ADP控制部分;对于上述三个部分,本发明进行了详细的说明。本发明通过设计数据驱动最优状态观测器,进行随机扰动系统的异策略数据驱动ADP控制。首次将数据驱动ADP方法首次用于状态完全不可测的系统;无模型LQG控制被推广到了连续时间系统;ADP设计中考虑了控制信号通道以外的非匹配噪声,以及不依赖状态和控制信号的独立噪声;提出一种针对随机扰动系统的新型异策略数据驱动ADP控制方法及介质,避免了需要反复读取和更新控制信号的负担,显著地减少了运算量。
-
公开(公告)号:CN110879531A
公开(公告)日:2020-03-13
申请号:CN201911154069.9
申请日:2019-11-22
申请人: 北京理工大学重庆创新中心 , 北京理工大学
IPC分类号: G05B13/04
摘要: 本发明公开了一种随机扰动系统的数据驱动自适应优化控制方法及介质,方法包括问题描述部分、数据驱动最优状态观测器的设计部分和随机扰动系统的异策略数据驱动ADP控制部分;对于上述三个部分,本发明进行了详细的说明。本发明通过设计数据驱动最优状态观测器,进行随机扰动系统的异策略数据驱动ADP控制。首次将数据驱动ADP方法首次用于状态完全不可测的系统;无模型LQG控制被推广到了连续时间系统;ADP设计中考虑了控制信号通道以外的非匹配噪声,以及不依赖状态和控制信号的独立噪声;提出一种针对随机扰动系统的新型异策略数据驱动ADP控制方法及介质,避免了需要反复读取和更新控制信号的负担,显著地减少了运算量。
-
公开(公告)号:CN118967747A
公开(公告)日:2024-11-15
申请号:CN202411023340.6
申请日:2024-07-29
申请人: 北京理工大学
IPC分类号: G06T7/246 , G06N3/0455 , G06N3/0464 , G06N3/082
摘要: 本发明公开了基于中期融合元框架和复合视觉提示的RGBT目标跟踪方法,涉及视觉目标跟踪技术领域,包括预训练的上游RGB跟踪网络并嵌入到中期融合多模态跟踪元框架中和利用三种视觉提示策略构建RGBT提示跟踪网络,然后在RGBT跟踪训练集上对网络进行提示微调;提示跟踪方法中包括一种中期融合元框架和单模态和跨模态探索提示策略、中间融合提示策略、模态与阶段感知提示策略。本方法通过极少量需要微调的额外参数实现上游知识在当前任务上参数高效的知识迁移,极大地减少了训练设备的负担,充分释放了提示学习在RGBT跟踪任务中的巨大潜力,并在模态主导性动态变化的多种复杂开放场景中实现了鲁棒的RGBT跟踪。
-
公开(公告)号:CN117873122A
公开(公告)日:2024-04-12
申请号:CN202311649621.8
申请日:2023-12-04
申请人: 北京理工大学
IPC分类号: G05D1/46 , G05D109/20
摘要: 本发明公开了一种基于强化学习的异构集群无人系统的分布式编队控制方法。本发明在传统最优控制的基础上引入强化学习方法,利用在线状态和输入信息迭代求解代数黎卡提方程,并且所有迭代都能够通过在固定的时间间隔内重复使用相同的状态和输入信息来进行,而不使用显式的、先验的系统内部动力学知识,能够摆脱现有关于多智能体系统编队控制的研究中对精确系统模型的较强依赖性;通过强化学习方法学习最优控制策略,平衡编队性能与能耗,在完成编队任务的同时满足代价最小。
-
公开(公告)号:CN116909277A
公开(公告)日:2023-10-20
申请号:CN202310878401.6
申请日:2023-07-18
申请人: 北京理工大学
IPC分类号: G05D1/02
摘要: 本发明公开了无需初始镇定学习策略的无人系统轨迹跟踪控制方法,涉及无人系统技术领域,使用本发明能够克服初始镇定控制策略对系统模型的依赖,保证了无人车系统在设计的强化学习控制器下实现对领导者的轨迹跟踪。首先建立无人系统模型;设计跟随者的轨迹跟踪控制器以及对应的代价函数,用于实现对跟随者的最优轨迹跟踪;在无人系统的增广系统的基础上引入偏移因子,构建新的闭环系统;根据新的闭环系统产生系统数据,并收集所述系统数据,利用策略迭代学习算法寻找最优控制策略,以实现无模型且不依赖初始镇定控制策略的轨迹跟踪控制。
-
公开(公告)号:CN116612345A
公开(公告)日:2023-08-18
申请号:CN202310410048.9
申请日:2023-04-18
申请人: 北京理工大学
IPC分类号: G06V10/774 , G06V10/82 , G06N3/084 , G06N3/0985 , G06N3/094
摘要: 本发明公开了一种基于元学习对抗特征的对抗训练方法和系统,涉及图像识别技术领域,能够提升深度神经网络模型的鲁棒性。首先对训练数据集批处理化,得到多个训练批次的数据输入至待训练的深度神经网络模型;对于每个批次的数据,计算神经网络模型的输出结果与该批次对应真实标签之间的损失函数,根据损失函数对初始化扰动进行梯度下降更新,获得该批次的元对抗扰动。选取最优的元对抗扰动,叠加在当前批次数据中,对当前训练批次数据执行梯度下降,并向允许扰动的范围内进行投影,得到当前训练批次数据对应的对抗样本数据。使用对抗样本数据对深度神经网络模型采用梯度下降方法进行训练,得到具备防御对抗攻击效果的鲁棒深度神经网络模型。
-
公开(公告)号:CN112613534B
公开(公告)日:2023-04-07
申请号:CN202011416110.8
申请日:2020-12-07
申请人: 北京理工大学
IPC分类号: G06F18/25 , G06F16/332
摘要: 本发明涉及一种多模态信息处理及交互系统,用于解决多模态交互系统中存在的模态融合方式简单,对话机制呆板的问题。包括多模态信息认知模块,多模态信息融合模块,以及多模态对话管理模块,其中,多模态信息认知模块用于对用户各模态交互信息进行识别,多模态信息融合模块利用D‑S证据理论将用户所有模态的交互信息进行意图融合,确定用户的最终交互意图,并得到对应于用户最终交互意图的可供机器识别的形式化指令;多模态对话管理模块针对多模态人机交互场景,采用有限状态机与信息槽填充方法相融合的对话管理模型,用于控制对话流程以及生成应答;本发明有效提高了用户交互意图识别准确率,实现了自然灵活的人机交互。
-
公开(公告)号:CN112613356B
公开(公告)日:2023-01-10
申请号:CN202011417147.2
申请日:2020-12-07
申请人: 北京理工大学
摘要: 本发明提供一种基于深度注意力融合网络的动作检测方法及装置,所述方法包括获取待检测视频;提取一个帧序列的初始特征;将所述初始特征输入残差通道‑空间注意力模块;所述初始特征经所述残差通道‑空间注意力模块处理,输出注意力机制调制后的特征;对所述注意力机制调制后的特征进行分层融合和迭代融合,得到融合特征;将所述融合特征的映射依次送入中心检测分支、位移检测分支、框检测分支处理,获得若干帧级检测窗口;基于ACT时间链接算法将所述若干帧级检测窗口连接成时空动作管道。根据本发明的方案,从通道和空间两个维度增强提取的初始特征,输出的特征不仅具有高级语义信息,也保留了低层次的空间信息。
-
公开(公告)号:CN112613349B
公开(公告)日:2023-01-10
申请号:CN202011402943.9
申请日:2020-12-04
申请人: 北京理工大学
摘要: 本发明提供一种基于深度混合卷积神经网络的时序动作检测方法及装置,所述方法包括获取待检测视频;将视频输入训练好的深度混合卷积神经网络,所述深度混合卷积神经网络模型包括特征编码模块、第一子网及第二子网;所述特征编码模块通过双流网络从原始视频数据中提取片段特征,所述第一子网基于所述特征编码模块提取的片段特征,获得一组提议特征,所述第二子网接收所述提议特征,基于所述提议特征之间的关系构建图,将构建的图输入GCN模型,扩大提议特征的接受区域;输出所述待检测视频的动作类别与动作起始、终止时间。根据本发明的方案,有效利用提议之间的关系,提高了时序动作检测的准确率,有效解决了时序动作检测。
-
公开(公告)号:CN115134253A
公开(公告)日:2022-09-30
申请号:CN202210594741.1
申请日:2022-05-27
申请人: 北京理工大学
IPC分类号: H04L41/14 , H04L41/142 , G06Q10/04 , G06F17/11
摘要: 本发明提出一种一阶加速优化的零和博弈双网决策方法,包括:步骤1,根据两个无向连接网络之间的智能体建立无向连接网络之间零和博弈问题模型,并确定非光滑双线性鞍点问题;步骤2,基于非光滑双线性鞍点问题设计进行智能体连通检测的纳什平衡状态的算法;步骤3:对所述算法形式进行变换并定义收敛速度度量函数;步骤4:求解获得非光滑双线性鞍点,并确定该非光滑双线性鞍点的纳什平衡状态。
-
-
-
-
-
-
-
-
-