一种科技成果数据文本挖掘方法、电子设备及存储介质
摘要:
本说明书实施例提供一种科技成果数据文本挖掘方法、电子设备及存储介质。所述方法包括:文本预处理,将一个高度概括的向量来表示文本数据,将所述文本数据集概括成一个向量集,所述向量集等同于一个二维表格,根据所述二维表格和所述文本数据特征进行文本预处理;文本特征标引,将预处理完成的文本数据进行分词,获取所述文本数据中的文本特征词;文本自动分类,取一个预分类的文本集作为训练集,分析训练集以导出分类模型,用一个检验过程对该分类模型求解,导出分类模型用于其它联机文本分类;文本聚类,对原始数据进行光谱嵌入,对维度归约后的文本空间运用聚类算法。
0/0