一种基于自然语言处理的单细胞相关技术数据分析方法

    公开(公告)号:CN113011133A

    公开(公告)日:2021-06-22

    申请号:CN202110200765.X

    申请日:2021-02-23

    Abstract: 本发明公开了一种基于自然语言处理的单细胞相关技术数据分析方法,包括如下步骤:步骤一、对单细胞相关技术的文本进行数据预处理;步骤二、利用TF‑IDF进行单细胞相关技术的文本表示,构建文档向量空间模型,生成文档向量;步骤三、对所述文档向量进行单细胞相关技术的文本特征提取,得到单细胞相关技术的文本研究的主题和特征项;步骤四、对主题词进行向量表达,生成主题词向量矩阵;步骤五、将所述主题词向量矩阵输入AP聚类模型,主题词进行聚类,得到单细胞相关技术的文本数据的热点词簇;步骤六、对所述热点词簇进行实体识别分析。

Patent Agency Ranking