基于内在奖励的视频游戏决策方法

发明公开

请登陆查看更多内容

专利标题： 基于内在奖励的视频游戏决策方法
申请号： CN202010370070.1

申请日： 2020-05-06
公开(公告)号： CN111260040A

公开(公告)日： 2020-06-09
发明人: 王轩 , 漆舒汉 , 张加佳 , 曹睿 , 何志坤 , 刘洋 , 蒋琳 , 廖清 , 夏文 , 李化乐
申请人： 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
申请人地址： 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
专利权人： 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
当前专利权人： 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
当前专利权人地址： 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
代理机构： 深圳市添源知识产权代理事务所
代理商 罗志伟
主分类号： G06N3/04
IPC分类号： G06N3/04 ; G06N3/08 ; A63F13/45 ; A63F13/46

摘要：

本发明提供了一种基于内在奖励的视频游戏决策方法，包括以下步骤：S1、获取视频游戏模拟环境；S2、构建神经网络模型；S3、设计内在奖励模型；S4、将内在奖励模型与构建的神经网络模型结构结合；S5、通过模拟环境获取游戏的记录；S6、通过获取的游戏记录，更新神经网络模型；S7、循环训练神经网络模型直至收敛。本发明的有益效果是：较好的解决了三维场景中较为常见的缺乏环境反馈奖励值的问题。

公开/授权文献

CN111260040B 基于内在奖励的视频游戏决策方法公开/授权日：2020-11-06

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06N	基于特定计算模型的计算机系统
G06N3/00	基于生物学模型的计算机系统
G06N3/02	.采用神经网络模型
G06N3/04	..体系结构，例如，互连拓扑