一种融合强化和对比学习的个性化习题推荐方法与推荐系统

    公开(公告)号:CN119089030A

    公开(公告)日:2024-12-06

    申请号:CN202310655470.0

    申请日:2023-06-05

    Abstract: 本发明公开了一种融合强化和对比学习的个性化习题推荐方法,所述方法使用自监督强化学习方法,将习题推荐过程形式化为马尔可夫决策过程,在学生和智能体之间进行交互作用,获得特征表示;同时融入对比学习思想,将相似的学习历史拉拢,不同的学习历史分开,以此来学习有效表征;对隐藏状态进行拼接,得到拼接后的表征#imgabs0#和#imgabs1#进一步得到整个习题和交互历史表示;将#imgabs2#和#imgabs3#作为输入,通过Q值函数计算、拼接,以得到最终的Q值;然后通过自监督强化学习方法,使累积奖励最大化;结合自监督、强化和对比学习损失,使用梯度下降进行模型训练,利用模型得到最终的习题推荐结果,向学生推荐更适合的习题。本发明还公开了实现上述方法的系统。

Patent Agency Ranking