山区铁路线路优化的深度强化学习方法

    公开(公告)号:CN114819286A

    公开(公告)日:2022-07-29

    申请号:CN202210338385.7

    申请日:2022-04-01

    Applicant: 广州大学

    Abstract: 本发明提出了一种山区铁路线路优化的深度强化学习方法,属于通信技术领域。本发明从组合优化的角度对提出了一种基于深度强化学习的山区铁路线路优化新框架,称为深度确定性政策梯度,重新设计了目标函数、环境、状态和动作,同时考虑各种对齐约束,深度确定性政策梯度模型生成铁路线形解决方案,无需预先确定交叉口或HPI的垂直点数量,也无需首先找到初始走廊。本发明深度确定性政策梯度模型生成铁路线形解决方案,无需预先确定交叉口或HPI的垂直点数量,也无需首先找到初始走廊,提高了运算效率。

Patent Agency Ranking