一种基于深层降噪自编码器的单细胞RNA-seq数据聚类方法
摘要:
本发明公开了一种基于深层降噪自编码器的单细胞RNA‑seq数据聚类方法,首先调整单细胞RNA‑seq数据的批次效应并对数据进行标准化从而减少技术噪声造成的不利影响;其次使用基于零膨胀负二项分布的深层降噪自编码器有效挖掘单细胞RNA‑seq数据的特征信息;然后使用快速独立成分分析方法对单细胞RNA‑seq数据进行降维,提高方法模型的计算效率;最后通过基于期望最大化的高斯混合模型对细胞展开更加准确的聚类,并使用T分布随机近邻嵌入的方法对最终的单细胞RNA‑seq数据聚类结果进行可视化。本发明能够有效降低单细胞RNA‑seq数据维度高、噪声大等特点对数据聚类的干扰,准确学习单细胞RNA‑seq数据的基因表达信息进而聚类细胞,为基因网络构建、发现细胞类型、癌症早期发现与治疗提供帮助。
0/0