一种基于深度强化学习的决策方法

    公开(公告)号:CN112295237A

    公开(公告)日:2021-02-02

    申请号:CN202011120754.2

    申请日:2020-10-19

    申请人: 深圳大学

    摘要: 本发明公开了一种基于深度强化学习的决策方法。该方法包括:智能体根据环境信息进行决策,选择决策后的动作;智能体将决策后的动作与知识库对比,并基于知识库中的设定规则集决定执行决策后的动作或替换决策后的动作;智能体将决策后的动作或替换后的动作在环境中执行,从环境中获得奖励和新的环境信息,并将旧环境信息、动作、奖励和新环境信息组合成经验信息,存入经验回放池;在经验回放池中随机选取设定数量的经验信息,以更新深度强化学习模型,进而指导下一次的迭代。利用本发明,能够缩短训练时间并避免作出灾难性决策,可广泛应用于动态决策领域。

    非单调推理在逻辑动作语言系统刻画中的知识表示方法

    公开(公告)号:CN112766505A

    公开(公告)日:2021-05-07

    申请号:CN202110037336.5

    申请日:2021-01-12

    申请人: 深圳大学

    IPC分类号: G06N5/02 G06N5/04

    摘要: 本发明公开了一种非单调推理在逻辑动作语言系统刻画中的知识表示方法。该方法对多种经典逻辑动作语言进行抽象刻画与性质表示,在统一的特性空间下,给出这些语言的最小特征集。该方法包括逻辑动作语言在回答集逻辑程序语法下的系统化自动翻译、确定性语义特性约束集合构建、稳定模型语义映射与一致性验证三部分内容。逻辑动作语言利用本发明能够系统性地表示与分析逻辑动作语言,并提高针对不同逻辑动作语言系统的知识表示与推理的适用性和效率。

    非单调推理在逻辑动作语言系统刻画中的知识表示方法

    公开(公告)号:CN112766505B

    公开(公告)日:2024-04-05

    申请号:CN202110037336.5

    申请日:2021-01-12

    申请人: 深圳大学

    IPC分类号: G06N5/02 G06N5/045

    摘要: 本发明公开了一种非单调推理在逻辑动作语言系统刻画中的知识表示方法。该方法对多种经典逻辑动作语言进行抽象刻画与性质表示,在统一的特性空间下,给出这些语言的最小特征集。该方法包括逻辑动作语言在回答集逻辑程序语法下的系统化自动翻译、确定性语义特性约束集合构建、稳定模型语义映射与一致性验证三部分内容。逻辑动作语言利用本发明能够系统性地表示与分析逻辑动作语言,并提高针对不同逻辑动作语言系统的知识表示与推理的适用性和效率。