基于用户评价的强化学习推荐方法、系统、终端及介质

    公开(公告)号:CN113468436A

    公开(公告)日:2021-10-01

    申请号:CN202110827188.7

    申请日:2021-07-21

    申请人: 长江大学

    摘要: 本发明公开了基于用户评价的强化学习推荐方法、系统、终端及介质,涉及互联网技术领域,其技术方案要点是:获取目标用户的用户评价向量、用户评分向量和权值向量;根据用户评价向量、用户评分向量和权值向量建立目标用户的状态值函数,并对状态值函数进行迭代优化后得到最优值函数;利用余弦相似度算法匹配得到与目标用户的状态函数值之间的余弦相似度大于相似度阈值的临近用户;选取临近用户中偏好值排序前列的至少一个物品推荐给目标用户。本发明通过在计算强化学习方法里的值函数中加入用户评价和用户评分两个因素,得到的值函数作为协同过滤中计算用户相似度,有效解决了协同过滤算法存在数据稀疏和冷启动等问题。