一种基于离线强化学习的交叉口车辆轨迹优化方法、系统

    公开(公告)号:CN116580556A

    公开(公告)日:2023-08-11

    申请号:CN202310535715.6

    申请日:2023-05-12

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于离线强化学习的交叉口车辆轨迹优化方法、系统,具体步骤如下:搭建智能网联环境下交叉口信号灯与网联车辆的通信场景,设定场景内车辆与信号灯的通信距离阈值,当车辆行驶至信号灯的控制区域时,双方可进行信息交互。收集信号交叉口网联车辆的运行轨迹和信号相位配时数据,将车辆在交叉口的行驶过程抽象为马尔科夫决策过程,将车辆旅行时间、车辆能耗、碰撞时间等作为马尔科夫决策奖励函数的参数,构建适用的数据集,在离线状态下通过强化学习方法训练车辆智能体得到适用的交叉口通行策略。本发明可应用于交叉口的车辆控制,通过控制车辆加速度使车辆按照最优轨迹行驶,实现车辆的节能减排和安全性能提升。

    一种基于两步聚类思路的县域城镇分类方法

    公开(公告)号:CN110610446A

    公开(公告)日:2019-12-24

    申请号:CN201910675029.2

    申请日:2019-07-25

    Applicant: 东南大学

    Abstract: 一种基于两步聚类思路的县域城镇分类方法,包含以下步骤:1)使用已收集的县域统计资料建立基础数据库;2)基于经济、人口等反映城镇化水平的指标,采取结构性聚类分析方法进行一级聚类,划分出高、中、低三种层级城镇化水平的县域城镇样本;3)进行二级聚类,筛选出反映城镇职能特性的主要因素,对县域城镇数据指标进行结构性聚类分析,划分出大类指标;4)采取主成分分析法分别确定每类指标组合的累计方差贡献率,用以验证二级聚类的有效性;5)针对不同数据指标的统计分布特性不同,采用改进的纳尔逊分类法,判别每一类中每个指标的优势度;6)采用组合分析法判断每个大类的优势组合,进行1-0二元评分,综合确定县域城镇的特性分类。

    一种网联车探测状态感知的交叉口强化学习信号控制方法

    公开(公告)号:CN114360266B

    公开(公告)日:2022-12-13

    申请号:CN202111560168.4

    申请日:2021-12-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种网联车探测状态感知的交叉口强化学习信号控制方法,在网联自动驾驶车辆具有一定市场渗透率的情况下,将交叉口进口道划分为一定数目的网格,以网联自动驾驶车辆作为移动传感器,探测周围车辆的实时位置、速度等数据,将数据填充到相应的进口道网格中,形成网格填充矩阵。将信号灯视作智能体并设计马尔可夫决策过程,以网格填充矩阵作为智能体状态,以相位切换为动作,以车辆更新等待时间为奖励函数。采用深度策略梯度算法训练智能体,可以减少车辆的等待时间,同时实现排队长度以及平均速度的优化。本发明提出的方法能够在对信号交通口进行控制时减少交通拥堵,缓解因交通拥堵带来的交通延误和碳排放及能源消耗。

    一种网联车探测状态感知的交叉口强化学习信号控制方法

    公开(公告)号:CN114360266A

    公开(公告)日:2022-04-15

    申请号:CN202111560168.4

    申请日:2021-12-20

    Applicant: 东南大学

    Abstract: 本发明公开了一种网联车探测状态感知的交叉口强化学习信号控制方法,在网联自动驾驶车辆具有一定市场渗透率的情况下,将交叉口进口道划分为一定数目的网格,以网联自动驾驶车辆作为移动传感器,探测周围车辆的实时位置、速度等数据,将数据填充到相应的进口道网格中,形成网格填充矩阵。将信号灯视作智能体并设计马尔可夫决策过程,以网格填充矩阵作为智能体状态,以相位切换为动作,以车辆更新等待时间为奖励函数。采用深度策略梯度算法训练智能体,可以减少车辆的等待时间,同时实现排队长度以及平均速度的优化。本发明提出的方法能够在对信号交通口进行控制时减少交通拥堵,缓解因交通拥堵带来的交通延误和碳排放及能源消耗。

Patent Agency Ranking