基于自主规划路径模型的无人车路径规划方法及装置

    公开(公告)号:CN118550290A

    公开(公告)日:2024-08-27

    申请号:CN202410572330.1

    申请日:2024-05-09

    申请人: 上海大学

    摘要: 本发明了公开一种基于自主规划路径模型的无人车路径规划方法及装置,涉及无人车规划路径领域,该方法包括在无人车与环境交互时将获取的四元组经验存入经验池;计算经验池中各个四元组经验的复合优先级,标记各个四元组经验的轨迹,利用优先级指数衰减分配方法对复合优先级数组进行更新,将更新后的复合优先级以及对应的四元组经验按照标记的轨迹存入至经验回放数组;根据重要性采样权重对经验回放数组进行采样得到采样四元组经验;利用采样四元组经验对自主规划路径模型进行训练,自主规划路径模型包括策略网络、价值网络和目标价值网络,利用训练后的策略网络,对无人车进行在线路径规划。本发明提高了无人车路径规划的准确率。

    一种基于样本状态对比表征的智能体自主行为决策方法

    公开(公告)号:CN118133988A

    公开(公告)日:2024-06-04

    申请号:CN202410438045.0

    申请日:2024-04-11

    申请人: 上海大学

    IPC分类号: G06N20/00 G06N5/01 G06N3/006

    摘要: 本发明公开一种基于样本状态对比表征的智能体自主行为决策方法,涉及无人系统自主决策技术领域,方法包括:通过当前迭代过程的训练样本确定当前迭代过程的高维正样本、高维负样本及高维锚点样本;将当前迭代过程的高维正样本及高维负样本输入至当前迭代过程优化后的键值编码器,确定当前迭代过程的低维正样本及低维负样本;采用当前迭代过程的低维正样本及低维负样本对当前迭代过程优化后的查询编码器进行优化,确定下一迭代过程优化后的查询编码器;根据将下一迭代过程的高维锚点样本输入至下一迭代过程优化后的查询编码器确定的第一低维锚点样本确定智能体的自主行为决策。提高了自主行为决策输入样本的效率,优化了自主行为决策的策略。