- 专利标题: 一种基于深层降噪自编码器的单细胞RNA-seq数据聚类方法
-
申请号: CN202111152923.5申请日: 2021-09-29
-
公开(公告)号: CN113889192B公开(公告)日: 2024-02-27
- 发明人: 王艺杰 , 王文庆 , 杨东 , 胥冠军 , 崔逸群 , 毕玉冰 , 刘超飞 , 董夏昕 , 刘迪 , 肖力炀 , 刘骁
- 申请人: 西安热工研究院有限公司
- 申请人地址: 陕西省西安市碑林区兴庆路136号
- 专利权人: 西安热工研究院有限公司
- 当前专利权人: 西安热工研究院有限公司
- 当前专利权人地址: 陕西省西安市碑林区兴庆路136号
- 代理机构: 西安智大知识产权代理事务所
- 代理商 王晶
- 主分类号: G16B40/00
- IPC分类号: G16B40/00 ; G06F18/2134 ; G06F18/23213
摘要:
本发明公开了一种基于深层降噪自编码器的单细胞RNA‑seq数据聚类方法,首先调整单细胞RNA‑seq数据的批次效应并对数据进行标准化从而减少技术噪声造成的不利影响;其次使用基于零膨胀负二项分布的深层降噪自编码器有效挖掘单细胞RNA‑seq数据的特征信息;然后使用快速独立成分分析方法对单细胞RNA‑seq数据进行降维,提高方法模型的计算效率;最后通过基于期望最大化的高斯混合模型对细胞展开更加准确的聚类,并使用T分布随机近邻嵌入的方法对最终的单细胞RNA‑seq数据聚类结果进行可视化。本发明能够有效降低单细胞RNA‑seq数据维度高、噪声大等特点对数据聚类的干扰,准确学习单细胞RNA‑seq数据的基因表达信息进而聚类细胞,为基因网络构建、发现细胞类型、癌症早期发现与治疗提供帮助。
公开/授权文献
- CN113889192A 一种基于深层降噪自编码器的单细胞RNA-seq数据聚类方法 公开/授权日:2022-01-04