基于文本相似度的在线课程论坛内容推荐方法及系统

    公开(公告)号:CN109063147A

    公开(公告)日:2018-12-21

    申请号:CN201810891236.7

    申请日:2018-08-06

    IPC分类号: G06F17/30 G06Q50/20

    CPC分类号: G06Q50/205

    摘要: 本发明提供了一种基于文本相似度的在线课程论坛内容推荐方法及系统,适用于在线教育的应用领域。本系统包括分词模块、词向量以及领域关键词提取模块、领域语料库和相似帖推荐列表生成模块。本方法将讨论帖的文本内容进行分词,提取词向量以及领域关键词;利用历史讨论帖构建领域语料库;从语料库中为用户正在浏览的讨论帖生成相似帖推荐列表。本发明提高了历史讨论内容的利用率,使用文本相似度分析技术,能够更准确的从课程内容层面比较两个讨论帖的语义相似度,为学生推荐更需要的相似贴,同时预先使用Jaccard距离进行初步筛选,再使用计算量较大的WMD距离度量讨论帖间的相似度,提高了推荐系统的效率,降低了计算量。