基于模型融合的牌型预测方法、装置、设备及存储介质

    公开(公告)号:CN115814428A

    公开(公告)日:2023-03-21

    申请号:CN202211427391.6

    申请日:2022-11-15

    摘要: 本发明属于棋牌游戏技术领域,公开了一种基于模型融合的牌型预测方法、装置、设备及存储介质。该方法包括:构建游戏环境;根据所述游戏规则与预设需求,确定奖励策略;获取当前牌局信息,根据所述当前牌局信息、奖励策略与强化学习模型,建立样本数据库;根据样本数据库对强化学习模型进行训练,建立对局模型;根据对局模型,得到对局数据;根据对局数据,对监督学习模型进行训练,得到牌型预测模型;根据目标牌局信息与牌型预测模型,得到预测数据,根据预测数据进行出牌。通过上述方式,利用强化学习从无到有的特性,结合监督学习的高效性,训练出最终的机器人模型,有效解决棋牌游戏机器人在新玩法中的冷启动问题,大幅降低项目运营成本。