基于深度强化学习的智能体自适应决策生成方法及系统

发明授权

CN113487039B 基于深度强化学习的智能体自适应决策生成方法及系统有权

请登陆查看更多内容

专利标题： 基于深度强化学习的智能体自适应决策生成方法及系统
申请号： CN202110729857.7

申请日： 2021-06-29
公开(公告)号： CN113487039B

公开(公告)日： 2023-08-22
发明人: 宋勇 , 程艳 , 庞豹 , 袁宪锋 , 许庆阳 , 巩志
申请人： 山东大学
申请人地址： 山东省威海市文化西路180号
专利权人： 山东大学
当前专利权人： 山东大学
当前专利权人地址： 山东省威海市文化西路180号
代理机构： 济南圣达知识产权代理有限公司
代理商 黄海丽
主分类号： G06N20/00
IPC分类号： G06N20/00 ; G06N3/092 ; G06N3/045 ; G06N3/084

摘要：

本公开提供了一种基于深度强化学习的智能体自适应决策生成方法及系统，基于深度强化学习SoftActor‑Cr it ic(SAC)算法对智能体自适应决策问题展开研究，并针对训练过程中出现的问题对SAC算法进行改进，提出了SAC+PER、SAC+ERE和SAC+PER+ERE算法，利用深度学习的强大感知能力和强化学习的高效决策能力解决智能体自适应决策问题，通过深度强化学习算法训练智能体，使其在与环境进行交互的过程中总结经验，从而形成自身对具体行为应用的认识；同时，以仿真环境下无人机反拦截任务为载体，验证了算法的有效性。

公开/授权文献

CN113487039A 基于深度强化学习的智能体自适应决策生成方法及系统公开/授权日：2021-10-08

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N20/00	机器学习