基于逆强化学习的ICU呼吸机与镇静剂管理方法及介质
摘要:
本发明的一种基于逆强化学习的ICU呼吸机与镇静剂管理方法及介质,其方法包括对获取的医疗数据根据医疗决策场景的需求进行分析重构,将数据脱敏处理,并进行归一化处理,建立相关数据集;建立逆强化学习模型;根据预处理后的数据集,将生理状态以及医疗干预手段建立MDP模型,根据变分贝叶斯理论,确定模型优化目标,从专家的过去诊断记录中获取解释该策略的奖惩函数;模型训练并优化,利用训练后的模型对ICU呼吸机与镇静剂管理进行管理。本方法采用逆强化学习方法,可以考虑长期以来的动作对患者带来的影响,而不是追求单步的反馈,这和医疗场景中,以患者最终治愈为目标相契合,实现贯序决策。
0/0