发明公开
- 专利标题: 一种基于双重状态增强的强化学习序列推荐方法及系统
-
申请号: CN202411288152.6申请日: 2024-09-14
-
公开(公告)号: CN118797356A公开(公告)日: 2024-10-18
- 发明人: 童向荣 , 孟子涵 , 王莹洁 , 张强 , 童兰昕 , 张兴林 , 王良
- 申请人: 烟台大学
- 申请人地址: 山东省烟台市莱山区清泉路30号
- 专利权人: 烟台大学
- 当前专利权人: 烟台大学
- 当前专利权人地址: 山东省烟台市莱山区清泉路30号
- 代理机构: 北京慧智兴达知识产权代理有限公司
- 代理商 孙越
- 主分类号: G06F18/214
- IPC分类号: G06F18/214 ; G06F18/20 ; G06F18/213 ; G06N5/025 ; G06N5/02 ; G06N5/04 ; G06N3/0442 ; G06N3/045 ; G06N3/0499 ; G06N3/092 ; G06F123/02
摘要:
本发明涉及强化学习和序列推荐技术领域,尤其是涉及一种基于双重状态增强的强化学习序列推荐方法及系统。所述方法,包括获取项目的知识图谱数据并按照时间戳对知识图谱数据进行排序,得到交互序列;根据交互序列和项目分布构建序列增强模型,包括构建序列增强层、构建知识感知增强层和构建奖励层;利用构建完成的序列增强模型结合双重状态增强机制,将序列增强模型的输出输入至马尔可夫决策框架,通过状态转移概率来更新模型状态;对序列增强模型进行模型训练,根据训练完成的序列增强模型,对用户进行实时推荐。本发明能够更好地捕捉序列中的全局和局部上下文信息,丰富状态表示,缓解状态空间稀疏问题。