模型训练及干预策略确定方法、装置、电子设备

发明公开

CN116844695A 模型训练及干预策略确定方法、装置、电子设备审中-实审

请登陆查看更多内容

专利标题： 模型训练及干预策略确定方法、装置、电子设备
申请号： CN202310734767.6

申请日： 2023-06-20
公开(公告)号： CN116844695A

公开(公告)日： 2023-10-03
发明人: 冯辉 , 李晓阳 , 张弛 , 吴爽 , 赵一楠 , 胡明月 , 彭若彤 , 刘晴偲 , 郭永真
申请人： 中南大学
申请人地址： 湖南省长沙市岳麓区麓山南路932号
专利权人： 中南大学
当前专利权人： 中南大学
当前专利权人地址： 湖南省长沙市岳麓区麓山南路932号
代理机构： 北京派特恩知识产权代理有限公司
代理商 胡亮; 张颖玲
主分类号： G16H20/70
IPC分类号： G16H20/70 ; G16H50/70 ; G06N20/00 ; G06F18/214

摘要：

本发明公开了一种模型训练及干预策略确定方法、装置、电子设备和存储介质。其中，该模型训练包括：从经验数据池中获取训练样本集；训练样本集中的训练样本包括：第一状态参数、动作参数、奖励参数和第二状态参数；第一状态参数表征影响老年人自我管理能力的变量，动作参数表征第一模型针对第一状态参数输出的干预策略，第二状态参数表征老年人执行干预策略后的状态参数；奖励参数表征第一模型针对干预策略输出的反馈奖励值；基于训练样本集训练第二模型；第一模型和第二模型为深度Q网络模型，第一模型和第二模型的网络结构相同，第二模型的模型参数用于更新第一模型的模型参数，第一模型用于根据老年人的状态参数输出干预策略。

信息查询

中国专利公布公告

审查信息

Global Dossier

Espacenet

IPC分类:

G	物理
G16	特别适用于特定应用领域的信息通信技术
G16H	医疗保健信息学，即专门用于处置或处理医疗或健康数据的信息和通信技术[ICT]
G16H20/00	特别适用于治疗或健康改善计划的ICT，例如用于处理处方，用于引导治疗或监测患者对医嘱的执行
G16H20/70	.与精神疗法相关，例如心理治疗或自体训练