一种实现自适应加速测试评估的方法及装置

    公开(公告)号:CN116088476A

    公开(公告)日:2023-05-09

    申请号:CN202310070263.9

    申请日:2023-01-12

    申请人: 清华大学

    IPC分类号: G05B23/02

    摘要: 本文公开一种实现自适应加速测试评估的方法及装置,包括:对从第二次开始的自适应加速测试,根据i‑1次之前的自适应加速测试的测试结果,确定第i次自适应加速测试的重要性采样函数;根据确定的重要性采样函数,确定测试场景Xi;在测试场景Xi中进行自适应加速测试,获得第i次的测试结果;根据获得的测试结果,确定基于控制变量的自适应加速评估方法的控制参数;根据确定的控制参数,计算第i次自适应加速测试的测试指标;根据测试指标判断出测试结果收敛时,将测试指标作为测试评估结果。本发明实施例通过结合多重重要性采样的自适应加速测试与基于控制变量的自适应加速评估,加速了测试场景生成,提高了自动驾驶汽车测试评估的效率。

    基于强化学习和相位竞争的自适应信号控制方法及系统

    公开(公告)号:CN114419884A

    公开(公告)日:2022-04-29

    申请号:CN202210031174.9

    申请日:2022-01-12

    申请人: 清华大学

    摘要: 本发明涉及一种基于强化学习和相位竞争的自适应信号控制方法及系统,其包括:与仿真环境交互得到交叉口状态,利用策略网络πθ的输出得到决策,在决策后收集奖励和下一时刻的状态,得到样本仿真轨迹;基于仿真轨迹,对PPO网络进行训练和参数更新,重复若干轮直至收敛。收敛后模型能基于交通流量的实时状态进行信号调整控制信号。本发明在保证信号控制的效果同时,能够适用于不同交叉口。本发明可以广泛在城市交通信号控制领域中应用。

    一种行人动力学模型参数调整方法和装置

    公开(公告)号:CN113887123A

    公开(公告)日:2022-01-04

    申请号:CN202110983155.1

    申请日:2021-08-25

    申请人: 清华大学

    IPC分类号: G06F30/27 G06F119/14

    摘要: 本申请实施例提供了一种行人动力学模型参数调整方法和装置,该方法包括:确定用于行人动力学模型参数调整的全局优化问题;所述全局优化问题用于搜索不同的人群密度下的人群平均移动速度与相应的真实人群平均移动速度的误差最小值;采用贝叶斯优化方法对获得的参数集进行迭代式优化,以求解所述全局优化问题,直至满足预设的迭代结束条件,输出计算出的所述误差的最小值对应的参数集,作为所述行人动力学模型的参数。通过该实施例方案,减少了人工干预,减少了对专家经验的依赖,降低综合成本,并避免了参数过早收敛到局部极小值。

    一种交叉口转向流量数据的获取方法、装置和存储介质

    公开(公告)号:CN111275975B

    公开(公告)日:2021-04-02

    申请号:CN202010131101.8

    申请日:2020-02-28

    申请人: 清华大学

    IPC分类号: G08G1/01 G08G1/065

    摘要: 本申请实施例提供一种交叉口转向流量数据的获取方法、装置和存储介质,所述方法包括:获取卡口过车数据和道路网数据;根据所述道路网数据,建立卡口转向可达矩阵,其中,所述卡口转向可达矩阵用于表征道路网中的各个交叉口内的卡口之间的可达性;基于所述卡口过车数据和所述卡口转向可达矩阵,计算道路网中的各个交叉口各自对应的交叉口转向流量数据。如此,能够获取到大规模的、细时间粒度的、低成本的、准确的交叉口转向交通流量数据。

    一种基于深度强化学习的多交叉口信号灯协同控制方法

    公开(公告)号:CN110060475B

    公开(公告)日:2021-01-05

    申请号:CN201910307621.7

    申请日:2019-04-17

    申请人: 清华大学

    摘要: 本发明涉及一种基于深度强化学习的多交叉口信号灯协同控制方法,其包括以下步骤:1)根据多交叉口交通网络的实际情况,建立能够反映该交通网络原始交通状态的多通道张量;2)根据得到的多交叉口交通网络的多通道张量,建立多交叉口协同控制神经网络模型;3)采用模仿学习和强化学习相结合的方法,对建立的多交叉口协同控制神经网络模型进行训练,得到训练好的多交叉口协同控制神经网络模型;4)将当前多交叉口的相位信息输入训练好的多交叉口协同控制神经网络模型,得到当前多交叉口信号灯的协同控制输出结果。本发明可以广泛应用于多交叉口信号灯协同控制领域。

    一种实时交通安全指数动态综合评价系统及其构建方法

    公开(公告)号:CN112037513A

    公开(公告)日:2020-12-04

    申请号:CN202010902854.4

    申请日:2020-09-01

    申请人: 清华大学

    摘要: 本发明涉及一种实时交通安全指数动态综合评价系统及其构建方法,其特征在于包括以下步骤:步骤1:采集影响交通事故的相关数据并提取各类数据的特征;步骤2:将采集的相关数据的特征作为自变量,历史交通事故数及等级构成的交通安全指数作为因变量,建立事故风险评估与预测模型,并求解模型参数;步骤3:根据步骤2得到的事故风险评估与预测模型,结合实时的路况、道路结构属性及驾驶安全系数计算不同区域发生交通事故数的期望,并根据预先建立的安全指数模型,计算得到不同区域的实时交通安全指数;步骤4:建立可视化展示平台,用于对不同区域的实时交通安全指数进行展示。本发明可以广泛应用于交通安全评价领域。

    基于合作博弈论成本分摊方法的单交叉口信号配时方法

    公开(公告)号:CN108364483B

    公开(公告)日:2020-07-14

    申请号:CN201810153803.9

    申请日:2018-02-22

    申请人: 清华大学

    IPC分类号: G08G1/07 G06N7/02

    摘要: 本发明涉及一种基于合作博弈论成本分摊方法的单交叉口信号配时方法,其特征在于包括以下步骤:1)采用合作博弈论中的成本分摊模型对单交叉口进行建模分析,得到单交叉口信号配时模型,包括成本特征函数和成本分摊函数;2)通过车路协同系统获取该单交叉口各个相位的计算参数,包括每个相位上一周期的排队长度、当前周期的进车率、出车率以及该交叉口总的信号灯周期;3)根据获取的单交叉口各个相位的计算参数以及信号配时模型,计算得到各个相位的绿时分配时长。本发明可以广泛应用于单交叉口的信号配时领域。

    一种智能网联汽车协同调度换道方法

    公开(公告)号:CN110956851A

    公开(公告)日:2020-04-03

    申请号:CN201911212449.3

    申请日:2019-12-02

    申请人: 清华大学

    IPC分类号: G08G1/16

    摘要: 本发明涉及一种智能网联汽车协同调度换道方法,其特征在于,包括以下步骤:1)初始化路段上所有待规划ICV的DQN网络的神经网络参数,以及路段上所有待规划ICV的共享网络参数和换道决策器参数;2)DQN网络对每一时刻待规划ICV本身的环境进行感知决策,得到待规划ICV的状态空间模型;3)DQN网络确定待规划ICV的左换道、右换道或直行决策;4)采用协同调度算法,对待规划ICV进行换道规划,得到存在安全间隙的待规划ICV换道轨迹;5)得到待规划ICV本次换道的用于训练DQN网络的奖励值;6)根据得到的状态空间模型和奖励值,对DQN网络进行训练后,进入步骤2),完成待规划ICV每一时段的无障碍换道,本发明可以广泛应用于智能网联汽车控制领域中。

    基于合作博弈论成本分摊方法的单交叉口信号配时方法

    公开(公告)号:CN108364483A

    公开(公告)日:2018-08-03

    申请号:CN201810153803.9

    申请日:2018-02-22

    申请人: 清华大学

    IPC分类号: G08G1/07 G06N7/02

    摘要: 本发明涉及一种基于合作博弈论成本分摊方法的单交叉口信号配时方法,其特征在于包括以下步骤:1)采用合作博弈论中的成本分摊模型对单交叉口进行建模分析,得到单交叉口信号配时模型,包括成本特征函数和成本分摊函数;2)通过车路协同系统获取该单交叉口各个相位的计算参数,包括每个相位上一周期的排队长度、当前周期的进车率、出车率以及该交叉口总的信号灯周期;3)根据获取的单交叉口各个相位的计算参数以及信号配时模型,计算得到各个相位的绿时分配时长。本发明可以广泛应用于单交叉口的信号配时领域。

    一种可变间隔发车的快速公交车组合调度方法

    公开(公告)号:CN105448082B

    公开(公告)日:2017-09-08

    申请号:CN201511021248.7

    申请日:2015-12-30

    申请人: 清华大学

    IPC分类号: G08G1/00

    摘要: 本发明属于公共交通调度优化技术领域,尤其涉及一种可变间隔发车的快速公交车组合调度方法:包括:确定站点总数、发车总次数并获取站点间车辆的行驶时间、客流信息、乘客的上车花费时间、下车花费时间、车辆停靠消耗时间;得到每个站点的上下车乘客数并以此确定站点类型为快速公交车站点或普通公交车站点,并以组合方式和发车间隔为决策变量,建立公交调度模型,计算出各车辆在各站点的停靠时间和上下车的乘客数,求出目标函数表达式,即计算出乘客平均等车时间、乘客平均在车时间和车辆平均载客人数;使用粒子群优化算法求解模型获得乘客平均等车时间、乘客平均在车时间尽可能小而车辆平均载客人数尽可能大的包含发车间隔和发车类型的调度方案。