自动驾驶汽车决策方法及装置

    公开(公告)号:CN113561986B

    公开(公告)日:2024-03-15

    申请号:CN202110946405.4

    申请日:2021-08-18

    发明人: 裴晓飞 杨哲

    IPC分类号: B60W50/00 B60W60/00

    摘要: 本发明实施例提供一种自动驾驶汽车决策方法及装置,所述方法包括:获取不同驾驶场景下的标准驾驶演示数据,根据标准驾驶演示数据进行模仿学习,得到不同驾驶场景下的最优奖励函数;基于最优奖励函数对对应的驾驶动作进行强化学习训练,得到下层驾驶动作决策模型;根据驾驶场景获取对应的交通状态,基于强化学习确定与下层驾驶动作决策模型对应的上层驾驶场景决策模型;检测到汽车处于自动驾驶模式中,通过上层驾驶场景决策模型,输出匹配的实时驾驶场景,然后确定对应的下层驾驶动作决策模型,输出对应的驾驶动作并执行。采用本方法能够更精确地对驾驶数据等进行规划,增加驾驶行为与人类驾驶行为的匹配度。

    一种基于移动终端的WIFI和视觉信息的室内定位方法及系统

    公开(公告)号:CN106767810B

    公开(公告)日:2020-04-21

    申请号:CN201611046894.3

    申请日:2016-11-23

    IPC分类号: G01C21/20

    摘要: 本发明公开了一种基于移动终端的WIFI和视觉信息的室内定位方法及系统,该方法包括以下步骤:S1、在室内的每个消防安全出口标志附近的位置,采集WIFI信号,同时拍摄消防安全出口标志的图像,并测量出口标志在平面地图中的坐标;S2、解析WIFI信息和图像信息,获取出口标志附近的WIFI信号地址及其信号强度,计算对应图像的SURF特征描述符,三维坐标系与世界坐标系之间的单应矩阵;将每个位置的信号强度列表、SURF特征描述符和单应矩阵保存到地图数据库中;S3、根据当前位置的信号强度列表和SURF特征描述符,找到地图数据库中匹配度最高的位置,结合对应位置地图图片的单应矩阵和定位误差经验值确定用户所在的具体位置。本发明无需增加信号基站,且室内定位精度高。

    一种基于移动终端的WIFI和视觉信息的室内定位方法及系统

    公开(公告)号:CN106767810A

    公开(公告)日:2017-05-31

    申请号:CN201611046894.3

    申请日:2016-11-23

    IPC分类号: G01C21/20

    摘要: 本发明公开了一种基于移动终端的WIFI和视觉信息的室内定位方法及系统,该方法包括以下步骤:S1、在室内的每个消防安全出口标志附近的位置,采集WIFI信号,同时拍摄消防安全出口标志的图像,并测量出口标志在平面地图中的坐标;S2、解析WIFI信息和图像信息,获取出口标志附近的WIFI信号地址及其信号强度,计算对应图像的SURF特征描述符,三维坐标系与世界坐标系之间的单应矩阵;将每个位置的信号强度列表、SURF特征描述符和单应矩阵保存到地图数据库中;S3、根据当前位置的信号强度列表和SURF特征描述符,找到地图数据库中匹配度最高的位置,结合对应位置地图图片的单应矩阵和定位误差经验值确定用户所在的具体位置。本发明无需增加信号基站,且室内定位精度高。

    基于模仿学习和离散强化学习的自动驾驶汽车决策方法

    公开(公告)号:CN117610681A

    公开(公告)日:2024-02-27

    申请号:CN202311623676.1

    申请日:2023-11-28

    发明人: 裴晓飞 杨哲

    IPC分类号: G06N20/00 G06N3/092 G06N3/084

    摘要: 本发明提供一种基于模仿学习和离散强化学习的自动驾驶汽车决策方法,基于强化学习DDQN算法,利用神经网络搭建不同驾驶场景下的强化学习决策模型;针对不同驾驶场景设计不同的奖励函数;基于不同驾驶场景下的驾驶演示数据对所述强化学习决策模型进行模仿学习预训练,得到预训练模型;基于奖励函数对预训练模型进行在线交互训练,得到最终强化学习决策模型;具体决策时,对于不同的驾驶场景调用对应的最终强化学习决策模型,从动作空间中选择出最佳决策动作并衔接底层规划控制模块,由底层规划控制模块负责动作执行。本发明能提高自动驾驶决策性能。

    基于通信和多智能体强化学习的多车编队决策方法及系统

    公开(公告)号:CN117539254A

    公开(公告)日:2024-02-09

    申请号:CN202311620690.6

    申请日:2023-11-28

    发明人: 裴晓飞 杨哲 杨波

    摘要: 本发明提供一种基于通信和多智能体强化学习的多车编队决策方法,面向不同的多车编队任务初始化对应的多车队形,基于多智能体强化学习QMIX算法利用神经网络搭建不同的多智能体决策模型;编队的每辆车辆中均设有若干个多智能体决策模型,每一个多智能体决策模型负责对应的编队任务;对于不同的编队任务分别设计对应的个体奖励函数和全局奖励函数;基于安全规则对本车进行安全动作空间筛选;基于奖励函数在编队场景中进行智能体决策模型的在线交互训练,优化智能体决策模型至完全收敛;对每一辆编队车辆,调用优化后的智能体决策模型,输出本车对应的分布最佳决策动作。本发明能提高对场景良好的泛化性。

    自动驾驶汽车决策方法及装置
    6.
    发明公开

    公开(公告)号:CN113561986A

    公开(公告)日:2021-10-29

    申请号:CN202110946405.4

    申请日:2021-08-18

    发明人: 裴晓飞 杨哲

    IPC分类号: B60W50/00 B60W60/00

    摘要: 本发明实施例提供一种自动驾驶汽车决策方法及装置,所述方法包括:获取不同驾驶场景下的标准驾驶演示数据,根据标准驾驶演示数据进行模仿学习,得到不同驾驶场景下的最优奖励函数;基于最优奖励函数对对应的驾驶动作进行强化学习训练,得到下层驾驶动作决策模型;根据驾驶场景获取对应的交通状态,基于强化学习确定与下层驾驶动作决策模型对应的上层驾驶场景决策模型;检测到汽车处于自动驾驶模式中,通过上层驾驶场景决策模型,输出匹配的实时驾驶场景,然后确定对应的下层驾驶动作决策模型,输出对应的驾驶动作并执行。采用本方法能够更精确地对驾驶数据等进行规划,增加驾驶行为与人类驾驶行为的匹配度。

    一种车载车道线检测系统及方法

    公开(公告)号:CN106874875A

    公开(公告)日:2017-06-20

    申请号:CN201710086674.1

    申请日:2017-02-17

    IPC分类号: G06K9/00

    CPC分类号: G06K9/00798

    摘要: 本发明公开了一种车载车道线检测系统及方法,该系统包括设置在行驶车辆上的处理单元,以及与处理单元相连的图像采集单元;其中:图像采集单元,用于实时采集车辆行驶过程中的车道图片,将其发送给处理单元;处理单元,用于通过离线/在线的方式获取车道线样本图片,建立车道线样本库;并提取车道线样本库中车道线的RGB像素值,建立G‑S颜色模型,在G‑S颜色模型的基础上输入行驶过程中的车道图片,通过似然概率计算和阈值分割检测出图片中的车道线,并通过Hough变换提取图片中的车道线。本发明能够克服环境变化或者光照变化带来的影响,有效提高车道线检测效果。

    一种基于汽车内后视镜的驾驶人状态监控与成像装置

    公开(公告)号:CN206317744U

    公开(公告)日:2017-07-11

    申请号:CN201621293423.8

    申请日:2016-11-29

    IPC分类号: B60R1/04 B60R11/04

    摘要: 本实用新型公开了一种基于汽车内后视镜的驾驶人状态监控与成像装置,包括数据采集模块、辅助成像模块、成像模块和电源模块;数据采集模块分别与辅助成像模块和成像模块相连,电源模块分别与数据采集模块、辅助成像模块和成像模块相连,其中:数据采集模块包括摄像机和可变焦摄像头,辅助成像模块包括汽车的内后视镜和可旋转的三维防抖云台,可变焦摄像头安装在摄像机上,摄像机安装在三维防抖云台上,三维防抖云台安装在汽车内与内后视镜相对的位置;旋转三维防抖云台使可变焦摄像头通过内后视镜的反射拍摄到驾驶员的图像。本实用新型操作简单,成本低廉,安全可靠,有利于推广。

    一种鱼类样本获取装置
    9.
    实用新型

    公开(公告)号:CN217742815U

    公开(公告)日:2022-11-08

    申请号:CN202221878255.4

    申请日:2022-07-18

    发明人: 杨哲

    IPC分类号: A01K69/08

    摘要: 本实用新型涉及鱼类获取技术领域,具体为一种鱼类样本获取装置,包括诱捕装置,所述诱捕装置底板的顶面固定安装有储存盒,所述诱捕装置的底板上呈三角形固定安装有安装筒,所述安装筒的内部固定安装有安装杆,且所述安装杆的外壁间隙配合有弹簧,所述安装杆的底端间隙配合有支撑杆,所述诱捕装置底部的中间位置处固定安装有安装座,通过设置诱捕装置和储存盒的作用,在将诱捕装置放入水中后,可以进行诱鱼并对目标鱼进行抓捕,且不会对鱼类造成损伤,通过设置的安装座、防水电机和转动叶片配合使用,通过防水电机的工作可以加速诱捕装置底部水流的流速,从而使得储存盒内存放的诱饵气味能够快速的扩散开来,进一步的加快诱鱼速率。