发明公开
- 专利标题: 基于内在奖励的视频游戏决策方法
-
申请号: CN202010370070.1申请日: 2020-05-06
-
公开(公告)号: CN111260040A公开(公告)日: 2020-06-09
- 发明人: 王轩 , 漆舒汉 , 张加佳 , 曹睿 , 何志坤 , 刘洋 , 蒋琳 , 廖清 , 夏文 , 李化乐
- 申请人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- 申请人地址: 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- 专利权人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- 当前专利权人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- 当前专利权人地址: 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- 代理机构: 深圳市添源知识产权代理事务所
- 代理商 罗志伟
- 主分类号: G06N3/04
- IPC分类号: G06N3/04 ; G06N3/08 ; A63F13/45 ; A63F13/46
摘要:
本发明提供了一种基于内在奖励的视频游戏决策方法,包括以下步骤:S1、获取视频游戏模拟环境;S2、构建神经网络模型;S3、设计内在奖励模型;S4、将内在奖励模型与构建的神经网络模型结构结合;S5、通过模拟环境获取游戏的记录;S6、通过获取的游戏记录,更新神经网络模型;S7、循环训练神经网络模型直至收敛。本发明的有益效果是:较好的解决了三维场景中较为常见的缺乏环境反馈奖励值的问题。
公开/授权文献
- CN111260040B 基于内在奖励的视频游戏决策方法 公开/授权日:2020-11-06