强化学习架构及强化学习架构模型参数拷贝方法
Abstract:
本发明实施例涉及一种强化学习架构及强化学习架构模型参数拷贝方法,包括:智能体学习模块、智能体交互模块和所述智能体学习模块与智能体交互模块之间的交互通道;所述智能体学习模块输出智能体模型参数,所述智能体模型参数通过所述交互通道传送并输入到所述智能体交互模块;所述智能体交互模块输出智能体决策单元与环境向量交互后的交互片段,所述交互片段通过所述交互通道传送并输入到所述智能体学习模块。由此架构,可以增强架构稳定性、提高架构学习效率和系统资源利用率,有助于更好更快地实现大规模强化学习。
Patent Agency Ranking
0/0