一种基于分布强化学习的通用可靠最短路方法
摘要:
本发明公开了一种基于分布强化学习的通用可靠最短路方法,所述基于分布强化学习的通用可靠最短路方法包括:S1:根据所有路径的概率分布表,利用训练方法,得到最优路径的概率分布表;S2:根据所述最优路径的概率分布表,利用决策方法,得到最优路径的起点、最优路径和最优路径的终点。本发明所提供的基于分布强化学习的通用可靠最短路方法,能够解决现有的基于分布强化学习的通用可靠最短路方法耗时且效率低下的问题。
公开/授权文献
0/0