一种基于双时延深度确定性策略梯度的船舶姿态控制方法

    公开(公告)号:CN118466562A

    公开(公告)日:2024-08-09

    申请号:CN202410620610.5

    申请日:2024-05-20

    申请人: 兰州大学

    IPC分类号: G05D1/49

    摘要: 本发明公开了基于双时延深度确定性策略梯度的船舶姿态控制方法,包含以下步骤:(1)根据强化学习原理,构建状态空间S、动作空间A和奖励函数R;(2)训练双时延确定性策略梯度算法,得到收敛的策略函数;(3)在模拟系统中使用策略和模拟状态,检测策略的安全性和稳定性;(4)在实际航行中使用策略和真实状态测试策略的安全性和稳定性;(5)迭代执行步骤s102至s104,直至船舶获得在复杂多变海域的安全性和稳定性。本发明使得船舶动力系统能够动态自适应调节,克服传统控制方法的依赖预设规则和经验、无法实时响应、没有考虑船舶能耗等因素带来的影响,在保证船舶整体的安全性前提下,尽可能提高乘客的乘坐舒适性以及货物运输的安全性。

    一种基于激光雷达与摄像机融合的交通灯检测与识别方法

    公开(公告)号:CN109583415B

    公开(公告)日:2022-09-30

    申请号:CN201811512935.2

    申请日:2018-12-11

    申请人: 兰州大学

    摘要: 本发明公开了一种基于激光雷达与摄像机融合的交通灯检测与识别方法,该方法包括:利用激光雷达当前扫描到的点云数据匹配已制作的高精度地图,并结合GPS‑INS定位系统进行定位,从而确定车辆当前的位置及姿态;将高精度地图中的交通灯坐标映射到激光雷达点云坐标系中,再将点云坐标系中的交通灯坐标映射到摄像机所拍摄的二维视频图像;利用摄像头采集包含交通灯的视频信息,处理成多帧图片,对图片进行切割;利用经切割处理的图片数据,通过识别系统得到识别内容。本方案实现了利用激光雷达与摄像机进行融合,对交通灯进行快速的检测与识别。

    一种基于高精度点云地图的地面过滤方法

    公开(公告)号:CN111323026A

    公开(公告)日:2020-06-23

    申请号:CN201811545515.4

    申请日:2018-12-17

    申请人: 兰州大学

    IPC分类号: G01C21/32 G06T17/05

    摘要: 本发明公开一种基于高精度点云地图的地面过滤方法。该方法包括:(1)采集道路的三维点云信息,并制作高精度点云地图;(2)在高精度点云地图中进行可行驶区域的标注与记录;(3)将可行驶区域划分成若干小块,对每一个小块进行平面模型提取,用该平面模型来代表该小块所覆盖的地面;(4)根据步骤(3)得到的地面模型过滤实时点云中的路面点。本方案实现了平面、坡道等各种路况下的可行驶区域中的路面点精准过滤。

    一种面向视频的可控文本摘要生成方法

    公开(公告)号:CN118570689A

    公开(公告)日:2024-08-30

    申请号:CN202310174847.0

    申请日:2023-02-28

    申请人: 兰州大学

    IPC分类号: G06V20/40 G06V10/80 G06V10/82

    摘要: 本发明公开了一种面向视频的可控文本摘要生成方法,包括步骤:(1)收集并构建场景视频数据集,针对数据集进行文本摘要数据标定;(2)将视频以秒为单位切割为多帧并标定文本构建控制信号;(3)基于CLIP网络和I3D网络提取视频的静态和动态特征并统一不同的视频特征维度;(4)利用Vision Transformer Encoder对融合特征进行编码;(5)利用多层LSTM网络对编码后的特征进行解码,生成可控的视频文本摘要;(6)利用强化学习优化模型参数。与现有技术相比,本发明构建控制信号,利用控制信号指导模型生成可控的视频摘要,同时解决了特征编码阶段隐藏状态的丢失问题,提高了视频摘要内容的准确性以及内容可控性。

    一种基于多智能体强化学习的视频摘要生成方法

    公开(公告)号:CN115982407B

    公开(公告)日:2023-09-19

    申请号:CN202210211270.1

    申请日:2022-03-05

    申请人: 兰州大学

    摘要: 本发明公开一种基于多智能体强化学习的视频摘要生成方法。视频摘要生成是通过对原有视频的简化和压缩并保留其中的关键信息,在视频监控领域应用前景广阔,可以极大地减轻存储压力并提高工作效率。传统的视频摘要生成方法通过对整体视频进行时间分割,得到每一帧的关键性分数之后,根据分值大小以及所需要的关键帧的数量合成摘要。本发明提出的基于多智能强化学习的视频摘要生成方法利用多个智能体之间的协同合作特点,对视频的关键帧进行优先级投票选择,模拟人类制作视频摘要数据集关键帧标注的过程,采用多智能体深度确定性策略梯度的方法进行参数的更新,利用Actor‑Critic框架和策略集成的方法进行模型训练,最终生成的摘要视频具有代表性和多样性。

    一种基于离线强化学习的机甲车自动行驶训练与控制方法

    公开(公告)号:CN116430860A

    公开(公告)日:2023-07-14

    申请号:CN202310315829.X

    申请日:2023-03-28

    申请人: 兰州大学

    IPC分类号: G05D1/02

    摘要: 本发明公开一种基于离线强化学习的机甲车自动行驶训练与控制方法,主要包括(1)人为控制机甲车按照制定路线行驶,获取机甲车行驶过程中的摄像头图像,位置信息和机甲车的状态信息,构建数据集;(2)使用离线强化学习算法在机甲车行驶数据集上训练,训练过程中在行驶控制指令中添加动作扰动;(3)获取机甲车的摄像头图像信息,使用特征网络提取机甲车自身位置和障碍物位置特征信息,Q网络和策略网络根据特征信息分别输出Q值和机甲车制行驶指令,设置安全性奖励函数和准确性奖励函数,智能体根据环境奖励反馈调整下一步行驶指令;(4)利用训练好的机甲车控制策略在真实环境中测试评估,迭代训练直到机甲车可以进行自动行驶和避障任务。

    一种基于激光雷达的单线数据分析对物体空间封闭的聚类方法

    公开(公告)号:CN111325229B

    公开(公告)日:2022-09-30

    申请号:CN201811544723.2

    申请日:2018-12-17

    申请人: 兰州大学

    摘要: 本发明公开一种基于激光雷达的单线数据分析对物体空间封闭的聚类方法,包括步骤S1:从激光雷达Velodyne中提取单线数据,并将每组单线数据映射到二维平面上;步骤S2:利用步骤S1中的二维平面数据,对每组数据使用切线的方法提取物体边缘线,依次分割提取出单个物体的边缘;步骤S3:对分割出的物体边缘点集处理获得物体的中心点,以及水平方向所占面积;步骤S4:组合所有二维平面单线数据,在三维空间中确定所有物体最终的精确位置及水平方向所占面积。本发明对距离过近的空间物体的分割聚类具有较好的鲁棒性。

    一种基于离线强化学习的机甲车自动行驶训练与控制方法

    公开(公告)号:CN116430860B

    公开(公告)日:2024-09-24

    申请号:CN202310315829.X

    申请日:2023-03-28

    申请人: 兰州大学

    IPC分类号: G05D1/43 G05D1/622

    摘要: 本发明公开一种基于离线强化学习的机甲车自动行驶训练与控制方法,主要包括(1)人为控制机甲车按照制定路线行驶,获取机甲车行驶过程中的摄像头图像,位置信息和机甲车的状态信息,构建数据集;(2)使用离线强化学习算法在机甲车行驶数据集上训练,训练过程中在行驶控制指令中添加动作扰动;(3)获取机甲车的摄像头图像信息,使用特征网络提取机甲车自身位置和障碍物位置特征信息,Q网络和策略网络根据特征信息分别输出Q值和机甲车制行驶指令,设置安全性奖励函数和准确性奖励函数,智能体根据环境奖励反馈调整下一步行驶指令;(4)利用训练好的机甲车控制策略在真实环境中测试评估,迭代训练直到机甲车可以进行自动行驶和避障任务。

    一种基于大模型微调的视频摘要生成方法

    公开(公告)号:CN117412147A

    公开(公告)日:2024-01-16

    申请号:CN202311033974.5

    申请日:2023-08-17

    申请人: 兰州大学

    摘要: 本发明公开一种基于大模型微调的视频摘要生成方法。视频摘要生成是使用文字对原有视频内容进行总结与概括,在多模态领域应用广泛。本发明提出的基于大模型微调技术的视频摘要生成方法包括以下步骤:(1)利用MACAW‑LLM大模型多模态融合的特点,将视频特征与文本特征进行跨模态交互;(2)采用CLIP、WHISPER完成对视频和音频特征提取;(3)使用GPT‑3.5Turbo生成指令辅助摘要生成算法;(4)使用注意力机制算法完成模态对齐,并与指令进行融合;(5)采用LoRA微调技术进行模型训练,最小化负对数似然函数对大模型参数进行迭代更新并生成视频摘要。本发明使用少量训练数据就可完成零样本迁移学习,最终生成的视频摘要答案准确、条理清晰、内容丰富。

    基于直接偏好优化的NAO机器人物体抓取训练方法

    公开(公告)号:CN117103255A

    公开(公告)日:2023-11-24

    申请号:CN202311033984.9

    申请日:2023-08-17

    申请人: 兰州大学

    摘要: 本发明公开了基于直接偏好优化的NAO机器人物体抓取训练方法,包含以下步骤:(1)采集并保存人类专家数据、模仿数据和使用强化学习策略在机器人模拟器中交互抓取动作的轨迹数据;(2)由人类标注员对轨迹数据中的状态动作轨迹序列数据对进行打分,得到基于人类偏好的轨迹数据集;(3)使用人类偏好数据集设计参考策略网络,设计参数化策略网络,结合参考策略网络构建最大似然目标,对目标函数进行梯度下降以得到最优策略;(4)训练目标物体识别模型,将物体识别模型和最优策略部署到真实NAO机器人,对机器人的抓取动作进行评估;(5)迭代训练过程和评估过程,直至机器人能够顺利抓取目标物体。