一种基于智能体优化的不完全信息游戏交互方法、存储介质、设备及计算机程序产品
摘要:
本发明公开了一种基于智能体优化的不完全信息游戏交互方法、存储介质、设备及计算机程序产品,包括:将收集的每个游戏信念输入智能体重玩相同的不完全信息游戏,更新游戏信念,进行游戏信念纠错,生成指令;将指令整合到提示中,根据提示中对应的指令使智能体再次重玩相同的不完全信息游戏,若重玩的游戏分数有提高,保留指令;否则,删除指令;将保留的指令基于DFS策略优化,筛选出最优的指令;在新的不完全信息游戏中,本方游戏玩家的智能体根据最优的指令、游戏共有信息和对应游戏玩家的私有信息,生成动作,其他游戏对手的智能体也生成动作,将所有动作输入到不完全信息游戏中进行交互。本发明提升智能体在不完全信息游戏中的交互能力。
0/0