-
公开(公告)号:CN110399458B
公开(公告)日:2023-05-26
申请号:CN201910598004.7
申请日:2019-07-04
申请人: 淮阴工学院
摘要: 本发明公开了一种基于潜在语义分析和随机投影的文本相似度计算方法,适用于普遍的无监督文本聚类问题。本发明首先对待处理的标签文本转换为词袋模型,并利用TF‑IDF算法对其进行赋权操作得到权重向量集。然后使用LSA算法对权重向量集进行处理得到LSA索引库,再对权重向量集使用随机投影算法进行处理得到RP索引库。最后将待计算语料进行TF‑IDF处理后,再分别使用LSA算法和RP算法处理后与索引库内容比对,得到文本相似度。本发明可以对文本内容进行有效相似度计算,并通过相似度较高文本进行相关内容推荐。
-
公开(公告)号:CN108960273A
公开(公告)日:2018-12-07
申请号:CN201810415338.1
申请日:2018-05-03
申请人: 淮阴工学院
CPC分类号: G06K9/6277 , G06K9/6256 , G06N3/08 , G06Q50/205
摘要: 本专利公开发明了一种基于深度学习的贫困生认定方法,本发明从学生一卡通消费数据、成绩数据、图书馆借阅数据中提取学生特征,将学生分为4个贫困等级并用one‑hot编码,将编码结果作为学生类别标签。使用提取的特征和类别标签训练搭建好的神经网络模型。当需要认定贫困生时,提取学生一卡通消费数据、成绩数据、图书馆借阅数据的特征,经过神经网络模型预测后得出学生类别。并将结果用于贫困生的辅助认定。本发明具有准确度高,隐藏层深度足够的特点。
-
公开(公告)号:CN110399916A
公开(公告)日:2019-11-01
申请号:CN201910669476.7
申请日:2019-07-24
申请人: 淮阴工学院
IPC分类号: G06K9/62
摘要: 本发明公开了一种基于图像增强和Inception网络的皮肤癌图像分类方法,首先读取皮肤癌图片和标签数据,对标签数据进行one-hot编码,对皮肤癌图像进行归一化处理。再划分训练集、验证集、测试集。然后对图像进行图像增强,接着使用训练集训练基于Inception网络的深度神经网络。当需要识别皮肤癌图像种类时,加载训练好的深度神经网络模型,对数据归一化处理后,训练好的模型对图片进行分类,得到皮肤癌图片的种类。本发明弥补了现有图像分类方法在数据量不够丰富时易过拟合的状况,有效的提高了皮肤癌图像分类的准确性。
-
公开(公告)号:CN110399458A
公开(公告)日:2019-11-01
申请号:CN201910598004.7
申请日:2019-07-04
申请人: 淮阴工学院
摘要: 本发明公开了一种基于潜在语义分析和随机投影的文本相似度计算方法,适用于普遍的无监督文本聚类问题。本发明首先对待处理的标签文本转换为词袋模型,并利用TF-IDF算法对其进行赋权操作得到权重向量集。然后使用LSA算法对权重向量集进行处理得到LSA索引库,再对权重向量集使用随机投影算法进行处理得到RP索引库。最后将待计算语料进行TF-IDF处理后,再分别使用LSA算法和RP算法处理后与索引库内容比对,得到文本相似度。本发明可以对文本内容进行有效相似度计算,并通过相似度较高文本进行相关内容推荐。
-
-
-