- 专利标题: 一种基于FPGA的A3C深度强化学习算法加速器
-
申请号: CN202310730296.1申请日: 2023-06-19
-
公开(公告)号: CN116739054A公开(公告)日: 2023-09-12
- 发明人: 葛芬 , 张国辉 , 周芳 , 李梓瑜 , 叶剑涛 , 龚文强 , 王浩 , 吴淑宁
- 申请人: 南京航空航天大学
- 申请人地址: 江苏省南京市秦淮区御道街29号
- 专利权人: 南京航空航天大学
- 当前专利权人: 南京航空航天大学
- 当前专利权人地址: 江苏省南京市秦淮区御道街29号
- 代理机构: 南京经纬专利商标代理有限公司
- 代理商 朱桢荣
- 主分类号: G06N3/0464
- IPC分类号: G06N3/0464 ; G06N5/04
摘要:
本发明公开了一种基于FPGA的A3C深度强化学习算法加速器,涉及人工智能的深度强化学习技术领域,包括上位机和FPGA加速器,上位机用于提供交互环境;FPGA加速器用于完成智能体推理与训练的计算加速,包括:存储模块;正向计算模块,用于完成神经网络的正向推理计算;反向计算模块,用于完成神经网络的反向传播计算;反向输入计算模块,用于完成反向输入图的计算;梯度计算模块,用于计算每一层参数的梯度;RMSProp参数更新模块,用于完成A3C算法中的RMSProp参数更新过程。本发明的加速器相对于通用处理器具有高能效的特点。
公开/授权文献
- CN116739054B 一种基于FPGA的A3C深度强化学习算法加速器 公开/授权日:2024-10-01