-
公开(公告)号:CN118797356A
公开(公告)日:2024-10-18
申请号:CN202411288152.6
申请日:2024-09-14
申请人: 烟台大学
IPC分类号: G06F18/214 , G06F18/20 , G06F18/213 , G06N5/025 , G06N5/02 , G06N5/04 , G06N3/0442 , G06N3/045 , G06N3/0499 , G06N3/092 , G06F123/02
摘要: 本发明涉及强化学习和序列推荐技术领域,尤其是涉及一种基于双重状态增强的强化学习序列推荐方法及系统。所述方法,包括获取项目的知识图谱数据并按照时间戳对知识图谱数据进行排序,得到交互序列;根据交互序列和项目分布构建序列增强模型,包括构建序列增强层、构建知识感知增强层和构建奖励层;利用构建完成的序列增强模型结合双重状态增强机制,将序列增强模型的输出输入至马尔可夫决策框架,通过状态转移概率来更新模型状态;对序列增强模型进行模型训练,根据训练完成的序列增强模型,对用户进行实时推荐。本发明能够更好地捕捉序列中的全局和局部上下文信息,丰富状态表示,缓解状态空间稀疏问题。