一种基于潜在语义分析和随机投影的文本相似度计算方法

    公开(公告)号:CN110399458B

    公开(公告)日:2023-05-26

    申请号:CN201910598004.7

    申请日:2019-07-04

    申请人: 淮阴工学院

    IPC分类号: G06F16/33 G06F16/35 G06F40/30

    摘要: 本发明公开了一种基于潜在语义分析和随机投影的文本相似度计算方法,适用于普遍的无监督文本聚类问题。本发明首先对待处理的标签文本转换为词袋模型,并利用TF‑IDF算法对其进行赋权操作得到权重向量集。然后使用LSA算法对权重向量集进行处理得到LSA索引库,再对权重向量集使用随机投影算法进行处理得到RP索引库。最后将待计算语料进行TF‑IDF处理后,再分别使用LSA算法和RP算法处理后与索引库内容比对,得到文本相似度。本发明可以对文本内容进行有效相似度计算,并通过相似度较高文本进行相关内容推荐。

    一种基于图像增强和Inception网络的皮肤癌图像分类方法

    公开(公告)号:CN110399916A

    公开(公告)日:2019-11-01

    申请号:CN201910669476.7

    申请日:2019-07-24

    申请人: 淮阴工学院

    IPC分类号: G06K9/62

    摘要: 本发明公开了一种基于图像增强和Inception网络的皮肤癌图像分类方法,首先读取皮肤癌图片和标签数据,对标签数据进行one-hot编码,对皮肤癌图像进行归一化处理。再划分训练集、验证集、测试集。然后对图像进行图像增强,接着使用训练集训练基于Inception网络的深度神经网络。当需要识别皮肤癌图像种类时,加载训练好的深度神经网络模型,对数据归一化处理后,训练好的模型对图片进行分类,得到皮肤癌图片的种类。本发明弥补了现有图像分类方法在数据量不够丰富时易过拟合的状况,有效的提高了皮肤癌图像分类的准确性。

    一种基于潜在语义分析和随机投影的文本相似度计算方法

    公开(公告)号:CN110399458A

    公开(公告)日:2019-11-01

    申请号:CN201910598004.7

    申请日:2019-07-04

    申请人: 淮阴工学院

    IPC分类号: G06F16/33 G06F16/35 G06F17/27

    摘要: 本发明公开了一种基于潜在语义分析和随机投影的文本相似度计算方法,适用于普遍的无监督文本聚类问题。本发明首先对待处理的标签文本转换为词袋模型,并利用TF-IDF算法对其进行赋权操作得到权重向量集。然后使用LSA算法对权重向量集进行处理得到LSA索引库,再对权重向量集使用随机投影算法进行处理得到RP索引库。最后将待计算语料进行TF-IDF处理后,再分别使用LSA算法和RP算法处理后与索引库内容比对,得到文本相似度。本发明可以对文本内容进行有效相似度计算,并通过相似度较高文本进行相关内容推荐。