基于强化学习的服务区开放控制决策方法和系统
摘要:
本发明涉及一种基于强化学习的服务区开放控制决策方法及系统,属于人工智能技术领域。所述方法包括:建立强化学习后的循环神经网络模型,所述模型的输出层用于智能预测下一时刻服务区周围存在的各种车辆分别对应的各个存在数量;基于下一时刻服务区周围存在的各种车辆分别对应的各个存在数量确定下一时刻之后预设时长内的服务区的关闭打开策略以及服务区内加油站的关闭打开策略。通过本发明,能够将循环神经网络应用到高速公路的服务区的开放控制的决策中,通过强化学习以及结构定制,构建了适应不同服务区的能够基于历史数据确定下一时刻过往车辆信息的人工智能识别机制,从而为服务区管理方的决策提供足够的反应时间。
0/0