一种基于评价-训练反馈的自动驾驶闭环自学习系统

    公开(公告)号:CN115271065A

    公开(公告)日:2022-11-01

    申请号:CN202210900426.7

    申请日:2022-07-28

    申请人: 同济大学

    IPC分类号: G06N3/08 G06N3/04

    摘要: 本发明涉及一种基于评价‑训练反馈的自动驾驶闭环自学习系统,包括:初始化模块,用于获取待训练的初始化参数,基于初始化参数构建待训练模型和训练环境;训练模块,用于对当前获取的待训练模型在当前的训练环境下进行训练;测试模块,用于对当前轮次训练收敛的算法模型进行测试;评价模块,用于对测试数据进行算法性能评价;判断模块,用于根据评价结果判断当前的算法模型是否满足循环截止判定条件或回溯判定条件;反馈模块,用于获取量化的评价结果,并基于预先构建的评价指标‑训练环境映射关系生成用于下一轮训练的新的训练环境,反馈至训练模型中,实现闭环反馈。与现有技术相比,本发明具有提高效率、实现自动化产出等优点。

    一种应用于自动驾驶汽车的决策规划协同增强方法

    公开(公告)号:CN114291112B

    公开(公告)日:2023-08-04

    申请号:CN202111651419.X

    申请日:2021-12-30

    IPC分类号: B60W60/00 B60W30/18 B60W40/00

    摘要: 本发明涉及一种应用于自动驾驶汽车的决策规划协同增强方法,包括以下步骤:S1:获取待规划车辆的驾驶环境中交通车辆的交通信息;S2:进行上层的换道倾向初始决策,并得出换道指令;S3:预测交通车辆的行驶轨迹及其未来可能出现位置的高斯概率分布;S4:根据预测获取的交通车辆的行驶轨迹及其未来可能出现位置的高斯概率分布,计算预测的交通车辆行驶轨迹未来每个时间戳内待规划车辆在行驶道路上的可行驶时空区域;S5:根据换道指令和可行驶时空区域,进行基于逻辑设计的决策规划信息互联及闭环增强,获取换道轨迹并进行自动驾驶。与现有技术相比,本发明有效提高了自动驾驶汽车的安全性、实用性及舒适性。

    基于数据机理融合的自动驾驶类人安全自进化方法和系统

    公开(公告)号:CN116300850A

    公开(公告)日:2023-06-23

    申请号:CN202211100337.0

    申请日:2022-09-08

    申请人: 同济大学

    摘要: 本发明涉及一种基于数据机理融合的自动驾驶类人安全自进化方法和系统,方法包括:从历史经验数据中,提取真实人类驾驶数据特征,通过最大熵逆强化学习算法,迭代提取出与该驾驶员决策习惯和规划习惯的目标函数;实时从交通环境中采样,获取环境信息,构建包括当前状态、动作、奖励和下一时刻状态的经验回访池,构建Q价值神经网络,从经验回访池抽取数据,对Q价值神经网络进行迭代更新,获取拟人化约束;建立车辆模型,并代入当前时刻的环境信息,构建车辆执行器约束,结合车辆模型、拟人化目标函数和拟人化约束进行搜索求解,获取车辆控制信息。与现有技术相比,本发明使得自动驾驶汽车具有自学习性和适应性,能实现安全、高效、舒适地驾驶。

    一种组合填料多级梯田式垂直流人工湿地污水处理方法

    公开(公告)号:CN102583764B

    公开(公告)日:2014-04-16

    申请号:CN201210068327.3

    申请日:2012-03-15

    申请人: 同济大学

    IPC分类号: C02F3/32

    CPC分类号: Y02W10/18 Y02W10/37

    摘要: 本发明属于环境保护技术领域,公开了一种组合填料多级梯田式垂直流人工湿地污水处理方法,该方法包括以下步骤:二级生化处理后的生活污水沉淀后,进入组合填料构成的多级梯田式垂直流人工湿地中,水质得到净化。本发明的方法具有处理效果好、效率高、抗冲击负荷能力强、运行稳定、投资费用低等优点。处理后出水中污染物排放的限值达到《城镇污水处理厂污染物排放标准》(GB18918-2002)中的一级A标准,其中COD在50mg/L以下,氨氮在5mg/L以下,总磷在0.5mg/L以下,总氮在15mg/L以下,可以直接排放。

    一种世界模型驱动的学习型可迁移自动驾驶方法及系统

    公开(公告)号:CN116501065A

    公开(公告)日:2023-07-28

    申请号:CN202310599940.6

    申请日:2023-05-25

    申请人: 同济大学

    IPC分类号: G05D1/02

    摘要: 本发明涉及一种世界模型驱动的学习型可迁移自动驾驶方法及系统,其中方法包括:构建仿真环境,并在仿真环境中设定与真实环境相同的配置;在仿真环境中采集大批量数据,在真实环境中采集小批量数据;构建世界模型,并利用大批量数据在仿真环境中进行模型训练,世界模型以相机图像作为输入,利用生成式世界模型对环境进行建模,通过隐藏变量保存并传递历史时刻的信息,输出鸟瞰图和控制指令;基于小批量数据在真实环境中进行域自适应迁移训练,并将模型部署在现实世界自动驾驶汽车中,实现虚实迁移的通用一体化自动驾驶。与现有技术相比,本发明创新了世界模型的建模方式,高效提取了环境动力学特征,实现了一体化自动驾驶,并能够实现虚实迁移。

    一种人在环的自动驾驶车辆交互学习控制方法及设备

    公开(公告)号:CN115257809A

    公开(公告)日:2022-11-01

    申请号:CN202210900448.3

    申请日:2022-07-28

    申请人: 同济大学

    摘要: 本发明涉及一种人在环的自动驾驶车辆交互学习控制方法及设备,所述方法包括以下步骤:采集自动驾驶车辆当前时刻的状态感知信息,基于训练好的DQN‑MPC双层控制模型获得下一刻的期望加速度和方向盘转角;所述DQN‑MPC双层控制模型基于人在环控制实现更新,在接收到驾驶员指令时,将所述驾驶员指令替换当前的决策指令,更新作为训练数据集的经验回放池,同时生成惩罚因子,该惩罚因子用于修正Q价值网络参数的更新。此外,本发明具有人类反馈预测功能,当可信度达到设置标准时,模型在环控制模块将代替长时间的人在环控制,解放驾驶员。与现有技术相比,本发明具有提高驾驶安全性和舒适性等优点。

    一种应用于自动驾驶汽车的决策规划协同增强方法

    公开(公告)号:CN114291112A

    公开(公告)日:2022-04-08

    申请号:CN202111651419.X

    申请日:2021-12-30

    申请人: 同济大学

    IPC分类号: B60W60/00 B60W30/18 B60W40/00

    摘要: 本发明涉及一种应用于自动驾驶汽车的决策规划协同增强方法,包括以下步骤:S1:获取待规划车辆的驾驶环境中交通车辆的交通信息;S2:进行上层的换道倾向初始决策,并得出换道指令;S3:预测交通车辆的行驶轨迹及其未来可能出现位置的高斯概率分布;S4:根据预测获取的交通车辆的行驶轨迹及其未来可能出现位置的高斯概率分布,计算预测的交通车辆行驶轨迹未来每个时间戳内待规划车辆在行驶道路上的可行驶时空区域;S5:根据换道指令和可行驶时空区域,进行基于逻辑设计的决策规划信息互联及闭环增强,获取换道轨迹并进行自动驾驶。与现有技术相比,本发明有效提高了自动驾驶汽车的安全性、实用性及舒适性。

    一种组合填料多级梯田式垂直流人工湿地污水处理方法

    公开(公告)号:CN102583764A

    公开(公告)日:2012-07-18

    申请号:CN201210068327.3

    申请日:2012-03-15

    申请人: 同济大学

    IPC分类号: C02F3/32

    CPC分类号: Y02W10/18 Y02W10/37

    摘要: 本发明属于环境保护技术领域,公开了一种组合填料多级梯田式垂直流人工湿地污水处理方法,该方法包括以下步骤:二级生化处理后的生活污水沉淀后,进入组合填料构成的多级梯田式垂直流人工湿地中,水质得到净化。本发明的方法具有处理效果好、效率高、抗冲击负荷能力强、运行稳定、投资费用低等优点。处理后出水中污染物排放的限值达到《城镇污水处理厂污染物排放标准》(GB18918-2002)中的一级A标准,其中COD在50mg/L以下,氨氮在5mg/L以下,总磷在0.5mg/L以下,总氮在15mg/L以下,可以直接排放。

    数据机理深度融合的自动驾驶安全高效进化方法及装置

    公开(公告)号:CN118205578A

    公开(公告)日:2024-06-18

    申请号:CN202410634624.2

    申请日:2024-05-22

    申请人: 同济大学

    发明人: 黄岩军 杨硕

    IPC分类号: B60W60/00 B60W40/00

    摘要: 本申请涉及自动驾驶技术领域,具体而言,涉及一种数据机理深度融合的自动驾驶安全高效进化方法及装置,一定程度上可以解决仍然需要大量专家数据的支撑,并且存在着安全性难以保证的隐忧,限制了其在自动驾驶领域的应用的问题。该方法包括:设计显空间规划架构,以计算并输出基于优化的自动驾驶策略;通过表征映射模型,将显空间状态量#imgabs0#映射至潜空间状态量#imgabs1#;将所述潜空间状态量#imgabs2#用于进行规划计算、策略网络学习及潜在动力学网络学习;通过显空间‑潜空间融合规划,进行价值网络对齐及策略对齐,从而输出融合后的当前最优自动驾驶策略。