一种基于聚类和隶属度融合的改进型文本分类算法

    公开(公告)号:CN106021578A

    公开(公告)日:2016-10-12

    申请号:CN201610380813.7

    申请日:2016-06-01

    发明人: 徐小龙 彭玉霞

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明公开了一种基于聚类和隶属度融合的改进型文本分类算法,该算法将待分类文本和训练文本集中的训练文本用向量空间表示,通过聚类算法将各个类别中的训练文本聚类,并合并同一个簇内的训练文本,形成新的文本向量,利用新的文本向量与待分类文本向量进行计算,从而得到待分类文本与各个类别的相似度以及待分类文本隶属各个类别的程度,将两者相加,最大值对应的类别即为待分类文本的类别。聚类算法在不裁剪原始样本数量的基础上减少文本分类算法执行的时间复杂度,隶属度改进了待分类文本的分类判定方式,考虑训练文本密度对分类判定的影响,提高文本分类的准确率,本发明有效解决了文本分类的算法时间复杂度和分类准确率问题。

    一种研究人员所属领域确定系统及其方法

    公开(公告)号:CN104951535B

    公开(公告)日:2019-03-26

    申请号:CN201510340895.8

    申请日:2015-06-18

    IPC分类号: G06F16/955

    摘要: 本发明公开了一种研究人员所属领域确定系统及其方法,包括五个步骤:包括如下步骤:步骤一:构建领域模型,确定本系统的领域分类并为所有领域划分属性,建立领域分类——领域属性矩阵;步骤二:分析研究人员在注册的时候所填写个人信息。步骤三:进一步研究人员所属的研究领域,对每个领域进行详细分类。步骤四:对研究人员进行领域初步划分后便推荐其所属领域的资源,并搜集研究人员访问站点时的操作行为。步骤五:将相同领域的研究人员互相推荐,形成一个细粒度交流圈。本发明有效解决了研究人员操作行为的缺少带来的冷启动和数据稀疏性问题。

    一种研究人员所属领域确定系统及其方法

    公开(公告)号:CN104951535A

    公开(公告)日:2015-09-30

    申请号:CN201510340895.8

    申请日:2015-06-18

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种研究人员所属领域确定系统及其方法,包括五个步骤:包括如下步骤:步骤一:构建领域模型,确定本系统的领域分类并为所有领域划分属性,建立领域分类——领域属性矩阵;步骤二:分析研究人员在注册的时候所填写个人信息。步骤三:进一步研究人员所属的研究领域,对每个领域进行详细分类。步骤四:对研究人员进行领域初步划分后便推荐其所属领域的资源,并搜集研究人员访问站点时的操作行为。步骤五:将相同领域的研究人员互相推荐,形成一个细粒度交流圈。本发明有效解决了研究人员操作行为的缺少带来的冷启动和数据稀疏性问题。

    一种基于聚类和隶属度融合的改进型文本分类算法

    公开(公告)号:CN106021578B

    公开(公告)日:2019-07-23

    申请号:CN201610380813.7

    申请日:2016-06-01

    发明人: 徐小龙 彭玉霞

    IPC分类号: G06F16/35 G06F17/27

    摘要: 本发明公开了一种基于聚类和隶属度融合的改进型文本分类算法,该算法将待分类文本和训练文本集中的训练文本用向量空间表示,通过聚类算法将各个类别中的训练文本聚类,并合并同一个簇内的训练文本,形成新的文本向量,利用新的文本向量与待分类文本向量进行计算,从而得到待分类文本与各个类别的相似度以及待分类文本隶属各个类别的程度,将两者相加,最大值对应的类别即为待分类文本的类别。聚类算法在不裁剪原始样本数量的基础上减少文本分类算法执行的时间复杂度,隶属度改进了待分类文本的分类判定方式,考虑训练文本密度对分类判定的影响,提高文本分类的准确率,本发明有效解决了文本分类的算法时间复杂度和分类准确率问题。

    流媒体数据块缓存方法及文件推荐方法、流媒体服务器

    公开(公告)号:CN103974084B

    公开(公告)日:2017-02-08

    申请号:CN201410191989.9

    申请日:2014-05-07

    摘要: 本发明公开了一种流媒体数据块缓存方法,属于网络流媒体技术领域。本发明的流媒体数据块缓存方法根据用户的实际需要对用户可能感兴趣的流媒体数据块进行预测,并根据预测结果将用户可能感兴趣的流媒体数据块预先缓存并推送给用户。本发明还公开了一种流媒体文件推荐方法及一种流媒体服务器,所述流媒体文件推荐方法对用户可能感兴趣的相关流媒体文件进行预测,并根据预测结果将用户可能感兴趣的相关流媒体文件向用户进行主动推荐;所述流媒体服务器包括兴趣值预测模块、缓存管理模块、推荐模块。相比现有技术,本发明能够降低服务器负载,提升播放连贯率,优化用户体验。

    流媒体数据块缓存方法及文件推荐方法、流媒体服务器

    公开(公告)号:CN103974084A

    公开(公告)日:2014-08-06

    申请号:CN201410191989.9

    申请日:2014-05-07

    摘要: 本发明公开了一种流媒体数据块缓存方法,属于网络流媒体技术领域。本发明的流媒体数据块缓存方法根据用户的实际需要对用户可能感兴趣的流媒体数据块进行预测,并根据预测结果将用户可能感兴趣的流媒体数据块预先缓存并推送给用户。本发明还公开了一种流媒体文件推荐方法及一种流媒体服务器,所述流媒体文件推荐方法对用户可能感兴趣的相关流媒体文件进行预测,并根据预测结果将用户可能感兴趣的相关流媒体文件向用户进行主动推荐;所述流媒体服务器包括兴趣值预测模块、缓存管理模块、推荐模块。相比现有技术,本发明能够降低服务器负载,提升播放连贯率,优化用户体验。