发明公开
- 专利标题: 模型训练及干预策略确定方法、装置、电子设备
-
申请号: CN202310734767.6申请日: 2023-06-20
-
公开(公告)号: CN116844695A公开(公告)日: 2023-10-03
- 发明人: 冯辉 , 李晓阳 , 张弛 , 吴爽 , 赵一楠 , 胡明月 , 彭若彤 , 刘晴偲 , 郭永真
- 申请人: 中南大学
- 申请人地址: 湖南省长沙市岳麓区麓山南路932号
- 专利权人: 中南大学
- 当前专利权人: 中南大学
- 当前专利权人地址: 湖南省长沙市岳麓区麓山南路932号
- 代理机构: 北京派特恩知识产权代理有限公司
- 代理商 胡亮; 张颖玲
- 主分类号: G16H20/70
- IPC分类号: G16H20/70 ; G16H50/70 ; G06N20/00 ; G06F18/214
摘要:
本发明公开了一种模型训练及干预策略确定方法、装置、电子设备和存储介质。其中,该模型训练包括:从经验数据池中获取训练样本集;训练样本集中的训练样本包括:第一状态参数、动作参数、奖励参数和第二状态参数;第一状态参数表征影响老年人自我管理能力的变量,动作参数表征第一模型针对第一状态参数输出的干预策略,第二状态参数表征老年人执行干预策略后的状态参数;奖励参数表征第一模型针对干预策略输出的反馈奖励值;基于训练样本集训练第二模型;第一模型和第二模型为深度Q网络模型,第一模型和第二模型的网络结构相同,第二模型的模型参数用于更新第一模型的模型参数,第一模型用于根据老年人的状态参数输出干预策略。